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A te EE 


本 书 是 一 本 基于 C++11 新 标准 的 并 发 和 多 线程 编程 深度 指南 。 内 容 包 括 
std::thread、std::mutex、std::future 和 std::async 等 基础 类 的 使 用 ， 内 存 模 型 和 原子 
操作 、 基 于 锁 和 无 锁 数 据 结构 的 构建 ， 以 及 并 行 算 法 和 线程 管理 ， 最 后 还 介绍 了 
多 线程 代码 的 测试 。 本 书 的 附录 部 分 还 对 C++11 新 语言 特性 中 与 多 线程 相关 的 项 
目 进 行 了 简要 的 介绍 ， 并 提供 了 C++11 线 程 库 的 完整 参考 。 


本 书 适 合 于 需要 深入 了 解 C++ 多 线程 开发 的 读者 ， 以 及 使 用 C++ 进行 各 类 软 
件 开 发 的 开发 人 员 、 测 试 人 员 阅 读 。 使 用 第 三 方 线程 库 的 读者 ， 也 可 以 从 本 书后 
a 
工具 书 


FP 


我 是 在 离开 大 学 后 的 第 一 份 工 作 中 遇 到 多 线程 编程 的 概念 的 。 我 们 当时 在 编 
写 一 个 数据 处 理应 用 程序 ， 它 需要 用 传 入 的 数据 记录 来 填充 数据 库 。 虽然 数据 很 
多 ， 但 每 个 数据 都 是 独立 的 ， 并 且 在 它 被 插入 数据 库 前 需要 大 量 的 处 理 。 闷 
分 利用 10-CPU UltraSPARC 的 能 力 ， 我 们 在 多 线程 中 运行 代码 ， 让 每 个 线程 处 理 
它们 上 自己 的 一 组 输入 数据 。 在 这 个 过 程 中 ， 我 们 用 C++ 编写 代码 ， 使 用 POSIX 线 
eue UE pue 尽管 多 线程 对 我 们 而 言 都 是 全 新 的 ， 但 我 们 最 终 还 

完成 了 。 正 是 在 这 个 项 目 中 的 工作 ， 我 第 一 次 了 解 了 C++ 标准 委员 会 和 全 新 发 
布 的 C++ 标准 - 


我 对 多 线程 和 并 发 有 前 所 未 有 的 兴趣 。 虽 然 别 人 认为 它 困 难 、 复 杂 ， 是 问题 
之 源 ， 但 我 却 视 它 为 强大 的 工具 ， 因 为 它 可 以 允许 你 利用 现 有 的 硬件 让 代码 运行 
得 更 快 。 随 后 我 了 解 到 它 即便 是 在 单 核 硬 件 上 也 能 提高 应 用 程序 的 响应 和 性 能 ， 
通过 使 用 多 线程 来 隐藏 详 如 7O 这 样 耗费 时 间 的 操作 延迟 。 我 还 了 解 了 它 怎样 在 
OS 级 别 工 作 以 及 Intel CPU 如 何 处 理 任务 切换 。 


同时 ， 我 对 C++ 的 兴趣 给 我 带 来 了 与 ACCU 以 及 BSI 的 C++ 标准 专家 组 以 及 
Boost 接 触 的 机 会 。 我 任 兴 趣 跟 进 了 Boost 线 程 库 的 初期 开发 ， 当 它 被 最 初 的 开发 
2M 我 便 趁 机 介入 了 。 我 从 此 成 为 了 Boost 线 程 库 最 主要 的 开发 者 和 维护 


当 C++ 标 准 委 员 会 的 工作 从 修正 现 有 标准 的 缺陷 转移 到 编写 下 一 代 标 准 〈 和 希 
望 在 2009 年 之 前 完成 故 命名 为 Ct++0x， 现 在 正式 为 Ct++11， 因 为 最 终 发 布 于 2011 
年 ) 的 提案 后 ， 我 更 多 地 参与 到 BSI 并 且 开 始 起 草 我 自己 的 提案 。 多 线程 刚 被 明 
确 地 提 上 议事 日 程 ， 我 就 全 力 以 赴 地 投入 进去 ， 并 且 撰 写 或 共同 撰写 了 许多 与 多 
线程 和 并 发 相关 的 提案 ， 它 们 组 成 了 新 标准 的 一 部 分 。 我 感到 很 荣幸 ， 可 以 有 这 
个 机 会 用 这 种 方式 组 合 我 的 计算 机 相关 的 两 大 兴趣 一 一 C++ 和 多 线程 。 


这 本 书信 稚 了 我 在 C++ 和 多 线程 上 的 全 部 经 验 ， 其 目标 是 教会 其 他 C++ 开 发 
ce ee pee eee ead 顺带 传授 一 些 我 在 这 方面 的 
热情 。 
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这 本 书 是 对 新 C++ 标准 中 的 并 发 和 多 线程 工具 的 深度 指南 ， 内 容 包 括 从 
std: :thread、std: :mutex 和 std: :async 的 基本 用 法 ， 到 复杂 的 原子 操作 与 内 
存 模型 。 


EK ZR I 
前 4 章 介绍 了 由 类 库 提 供 的 各 种 类 库 工具 以 及 他 们 如 何 使 用 。 


第 5 章 涵 盖 了 内 存 模型 和 原子 操作 的 低 阶 基础 ， 包 括 原子 操作 怎样 在 其 他 代 
码 上 强制 实行 排序 约束 ， 并 标志 着 导言 章节 的 结束 。 

第 6 章 和 第 7 章 开 始 涵盖 高 阶 的 论题 ， 包 括 一 些 如 何 使 用 基础 工具 来 构造 更 复 
第 6 章 中 基于 锁 的 数据 结构 ， 以 及 第 7 章 中 无 锁 的 数据 结 


第 8 章 继 续 高 阶 论 题 ， 包 括 如 何 设计 多 线程 代码 的 指南 ， 涵 盖 了 影响 性 能 的 
论点 ， 以 及 各 种 并 行 算 法 的 示范 实现 。 


第 9 章 涵 盖 了 线程 管理 一 一 线程 池 、 工 作 队 列 和 中 断 操 作 。 
第 10 理 包括 了 测试 和 调试 bug 的 类 型 ， 定 位 它们 的 技巧 ， 如 何 测试 它 


们 ， 等 等 。 


附件 包含 了 对 由 新 标准 引入 的 与 多 线程 相关 的 一 些 新 语言 工具 的 简要 介绍 ， 
第 4 章 中 提 到 的 消 妃 传递 库 的 具体 实现 ， 以 及 C++11 线 程 库 的 完整 参考 。 


谁 应 该 阅读 本 书 


如 果 你 打算 用 C++ 编 写 多 线程 代码 ， 你 就 应 该 阅读 本 书 。 如 果 你 正 要 使 用 
C++ 标准 库 中 新 的 多 线程 工具 ， 这 本 书 是 必 备 的 指南 。 如 果 你 正 使 用 蔡 代 的 线程 
库 ， 后 面 几 章 中 的 指引 和 技巧 应 该 也 是 有 用 的 。 


假设 你 对 C++ 已 经 有 了 很 好 的 了 解 ， 但 对 新 的 语言 特性 却 不 甚 熟悉， 这 些 在 
HRAT BIRER. PEIN SAREAD, ENA 
阅读 本 书 。 


如 何 使 用 本 书 


如 果 你 以 前 从 未 写 过 多 线程 代码 ， 我 建议 你 按 顺序 从 头 到 尾 阅读 本 书 ， 可 以 
跳 过 第 5 章 中 的 细节 部 分 ， 但 第 7 重大 量 依赖 第 5 章 中 的 材料 ， 所 以 如 果 你 跳 过 了 
第 5 章 ， 你 一 定 要 阅览 第 7 章 ， 除 非 你 曾 读 过 。 


如 果 你 之 前 未 曾 使 用 过 C++11 语 言 工 具 ， 在 你 开始 确定 准备 快速 开始 书 中 例 
子 之 前 最 好 浏览 一 下 附录 A。 新 语言 工具 的 使 用 凸显 在 文字 之 中 ， 然 而 ， 当 你 遇 
到 了 之 前 没有 见 过 的 东西 时 ， 总 是 可 以 翻 看 附录 的 。 


如 果 你 在 其 他 环境 中 拥有 大 量 编写 多 线程 代码 的 经 验 ， 开 始 的 几 章 可 能 让 你 
值得 浏览 一 和 表 ， 以 便 你 可 以 看 看 你 了 解 的 工具 怎样 映射 到 新 C++ 标准 中 。 如 果 你 
打算 用 原子 变量 做 一 些 低 阶 的 工作 ， 第 5 章 就 是 必需 的 。 为 了 确认 你 熟悉 多 线程 
C++ 中 类 似 寞 常安 全 的 东西 ， 值 得 阅览 一 下 第 8 章 。 如 果 你 在 脑海 中 有 特定 的 任 
务 ， 索 引 和 目录 可 以 帮助 你 快速 找到 相关 的 章节。 

一 旦 你 打算 促进 C++ 线程 库 的 使 用 ， 附 录 D 应 该 仍然 有 用 ， 比 如 查询 每 个 类 
和 函数 调用 的 细节 。 你 可 能 会 想 一 次 又 一 次 地 翻 回 主 章 节 ， 来 刷新 你 对 某 一 概念 
的 使 用 或 者 看 一 看 示例 代码 。 


代码 约定 和 下 载 


所 有 代码 清单 和 正文 中 的 源 代 码 ， 出 现 等 宽 字 体 (like this) ， 是 为 了 便 
于 从 常规 文本 中 区 分 出 来 。 代 码 注解 伴随 着 很 多 清单 ， 指 出 重要 的 概念 。 在 有 些 
情况 下 ， 数 字符 号 往往 指向 清单 后 面 的 注释 。 

本 书 中 所 有 的 工作 示例 源 代 码 可 以 在 出 版 社 网 址 下 载 ， 


www.manning.com/CPlusPlusConcurrencyinAction o 


软件 需求 


为 了 直截了当 地 使 用 本 书 中 的 代码 ， 你 需要 一 个 最 新 的 C++ 编译 器 ， 它 支持 
示例 中 使 用 的 新 的 C++11 语 言 特性 (参见 附录 A) ， 并 且 你 需要 C++ 标准 线程 库 的 


副本 


在 撰写 本 书 的 时 候 ， ae E 带 有 标准 线程 库 实现 的 编译 器 ， 
尽管 Microsoft Visual Studio 2011 预 览 版 也 包括 了 实现 。 线 程 库 的 g++ 实现 最 早 是 
在 gt+ 4.3 中 引入 了 基本 形式 ， 并 且 在 后 来 的 版 本 中 进行 了 扩展 。g++ 4.3 也 引入 了 
一 些 新 C++11 语 言 特性 的 初次 支持 ， 对 新 语言 特性 更 多 的 支持 在 各 个 后 续 版 本 
中 。 详 情 参见 g++ CHIRA KM. 


Microsoft Visual Studio 2010 提 供 了 一 些 新 C++11 语 言 特性 ， 例 如 右 值 引用 和 
lambda 函 数 ， 但 并 不 带 有 线程 库 的 实现 。 


作者 的 公司 Just Soft Solutions Ltd， 出 售 为 Microsoft Visual Studio 2005、 
Microsoft Visual Studio 2008. Microsoft Visual Studio 2010 和 g++ 的 各 种 版 本 四 设计 
的 C++11 标 准 线程 库 的 完整 实现 。 这 些 实现 已 被 用 来 测试 本 书 中 的 示例 。 


Boost 线 程 库 提供 了 基于 C++ 标 准 线程 库 提 案 的 API， 可 以 移植 到 许多 平 

。 本 书 中 的 大 部 分 示例 可 以 通过 审慎 地 将 std: : 替换 成 boost : :进行 修改 ， 并 
2 ， 来 与 Boost 线 程 库 一 起 工作 。 在 Boost 线 程 库 中 有 少数 
工具 不 受 文 持 〈 比 如 std: ane) 或 者 拥有 不 同 的 名 称 〈 比 如 


boost::unique future) 。 


作者 在 线 


购买 C++ Concurrency in Action 包 括 了 免费 访问 由 Manning 出 版 社 运 营 的 私有 
网 络 论坛 ， 在 这 里 你 可 以 对 本 书 做 出 评论 ， 提 问 技 术 问 题 ， 并 且 从 作者 和 其 他 用 
户 那里 得 到 帮助 。 如 果 要 访问 此 论坛 并 订阅 它 ， 可 以 访问 网 址 
www.manning.com/CPlusPlusConcurrencyinAction。 该 页 面 提供 了 论坛 的 使 用 指南 
以 及 论坛 上 的 行为 规则 。 


Manning 对 我 们 读者 的 承诺 是 提供 一 个 场所 ， 在 这 里 每 个 读者 之 间 以 及 读者 
和 作者 之 间 可 以 进行 有 意义 的 对 话 。 就 作者 而 言 并 没有 承诺 任何 规定 的 参与 量 ， 
作者 对 本 书 论坛 的 页 献 只 是 义务 的 〈 且 无 偿 的 ) 。 我 们 建议 你 试 着 向 作者 提问 一 
些 有 挑战 性 的 问题 ， 以 免 他 失去 兴趣 ! 


作者 在 线 论 坛 以 及 过 往 讨论 的 归档 ， 在 本 书 在 印 期 间 都 可 以 从 出 版 社 网 站 进 
行 访问 。 


[1] GNU Compiler Collection C++0x/C++11 状 态 页 
I], http://gcc.gnu.org/projects/cxx0x.html. 


[2] C++ 标 准 线程 库 的 just::thread 实 现 ，http://www.stdthread.co.uk。 


[3] Boost C++ 库 集合 ，http://www.boost.org。 


印刷 资源 


Cargill, Tom, “Exception Handling: A False Sense of Security,”in C++ Report 6, 
no. 9, (November-December 1994). Also available at 
http://www. informit.com/content/images/ 
020163371x/supplements/Exception Handling Article.html. 


Hoare, C.A.R., Communicating Sequential Processes (Prentice Hall International, 
1985), ISBN 0131532898. Also available at http://www.usingcsp.com/cspbook.pdf. 


Michael, Maged M., *Safe Memory Reclamation for Dynamic Lock-Free Objects 
Using Atomic Reads and Writes"in PODC"02: Proceedings of the Twenty-first Annual 
Symposium on Principles of Distributed Computing (2002), ISBN 1-58113-485-1. 


. U.S. Patent and Trademark Office application 20040107227, *Method for 
efficient implementation of dynamic lock-free data structures with safe memory 
reclamation." 


Sutter, Herb, Exceptional C++: 47 Engineering Puzzles, Programming Problems, 
and Solutions (Addison Wesley Professional, 1999), ISBN 0-201-61562-2. 


. “The Free Lunch Is Over: A Fundamental Turn Toward Concurrency in 
Software,"in Dr. Dobb's Journal 30, no. 3 (March 2005). Also available at 
http://www.gotw.ca/publications/ concurrency-ddj.htm. 


在 线 资 源 
Atomic Ptr Plus Project Home, http://atomic-ptr-plus.sourceforge.net/. 
Boost C++ library collection, http://www.boost.org. 
C++0x/C++11 Support in GCC, http://gcc.gnu.org/projects/cxxOx.html. 


C++11—The Recently Approved New ISO C++ Standard, http://www.research.att. 
com/~bs/C++0xFAQ.html. 


Erlang Programming Language, http://www.erlang.org/. 
GNU General Public License, http://www.gnu.org/licenses/gpl.html. 
Haskell Programming Language, http://www.haskell.org/. 


IBM Statement of Non-Assertion of Named Patents Against OSS, 
http://www.ibm.com/ ibm/licensing/patents/pledgedpatents.pdf. 


Intel Building Blocks for Open Source, http://threadingbuildingblocks.org/. 


The just::thread Implementation of the C++ Standard Thread Library, http://www. 
stdthread.co.uk. 


Message Passing Interface Forum, http://www.mpi-forum.org/. 


Multithreading API for C++OX—A Layered Approach, C++ Standards Committee 
Paper N2094, http://www.open-std.org/jtc1/sc22/wg21/docs/papers/2006/n2094.html. 


OpenMP, http://www.openmp.org/. 


SETI@Home, http://setiathome.ssl.berkeley.edu/. 


简要 目录 


E E # E 小 E B 
N eo ol AR wa N m 
Eo dk Wk ik mo uk ik i 


# 
co 


草 


你 好 ，C++ 并 发 世界 1 

管理 线程 13 

在 线程 间 共享 数据 31 
同步 并 发 操作 63 

C++ 内 存 模型 和 原子 类 型 操作 97 
设计 基于 锁 的 并 发 数据 结构 140 
设计 无 锁 的 并 发 数据 结构 ”170 
设计 并 发 代码 213 

高 级 线程 管理 258 

多 线程 应 用 的 测试 与 调试 ”285 
C++11 部 分 语言 特性 简明 参考 299 
并 发 类 库 简要 对 比 ”324 

消息 传递 框架 与 完整 的 ATM 示 例 326 


C++ 线程 类 库 参 考 344 


PIE ”你 好 ，C++ 并 发 世界 


本 章 主 要 内 容 


e. 何谓 并 发 和 多 线程 

。 为 什么 要 在 应 用 程序 中 使 用 并 发 和 多 线程 
© C++ 并 发 文 持 的 发 展 历程 

。 一 个 简单 的 C++ 多 线程 程序 是 什么 样 的 


这 是 令 C++ 用 户 振奋 的 时 刻 。 距 1998 年 初始 的 C++ 标 准 发 布 13 年 后 ，C++ 标 准 
委员 会 给 予 程 序 语言 和 它 的 支持 库 一 次 重大 的 变革 。 新 的 C++ 标准 《也 被 称 为 
于 2011 年 发 布 并 带 来 了 很 多 的 改变 ， 使 得 C++ 的 应 用 更 加 容易 并 
Ed 效 。 


在 C++11 标 准 中 一 个 最 重要 的 新 特性 就 是 文 持 多 线程 程序 。 这 是 C++ 标准 第 
一 次 在 语言 中 承认 多 线程 应 用 的 存在 ， 并 在 库 中 为 编写 多 线程 应 用 程序 提供 组 
件 。 这 将 使 得 在 不 依赖 平台 相关 扩展 下 编写 多 线程 C++ 程序 成 为 可 能 ， 从 而 允许 
以 有 保证 的 行为 来 编写 可 移植 的 多 线程 代码 。 这 也 恰 逢 程序 员 寻 求 更 多 普遍 的 并 
发 ， 特 别 是 多 线程 程序 ， 来 提高 应 用 程序 的 性 能 。 


这 本 书 讲述 的 就 是 C++ 编程 中 对 多 线程 并 发 的 使 用 ， 以 及 相关 的 C++ 语言 特 
性 和 库 工 具 。 我 会 以 解释 并 发 和 多 线程 的 含义 以 及 为 什么 要 在 应 用 程序 中 使 用 并 
发 开始 。 在 快速 全 方位 地 阐述 为 什么 在 应 用 程序 中 会 不 使 用 并 发 之 后 ， 我 会 对 
C++ 中 并 发 支持 进行 概述 ， 并 以 一 个 简单 的 C++ 并 发 实例 结束 这 一 章 。 具 有 开发 
多 线程 应 用 程序 经 验 的 读者 可 以 跳 过 前 面 的 小 节 。 在 随后 儿童 将 会 涵盖 更 多 广泛 
的 例子 ， 并 且 更 深入 地 了 解 库 工 具 。 本 书 最 后 附 有 对 多 线程 与 并 发 全 部 的 C++ 标 
准 库 工具 的 深入 参考 。 


那么 ， 什 么 是 并 发 (concurrency) 和 多 线程 (multithreading) ? 


1.1 什么 是 并 发 


在 最 简单 和 最 基本 的 层面 ， 并 发 是 指 两 个 或 更 多 独立 的 活动 同时 发 生 。 并 发 
在 生活 中 随处 可 见 。 我 们 可 以 一 边 走 路 一 边 说 话 ， 也 可 以 两 只 手 同时 做 不 同 的 动 
作 ， 还 有 我 们 每 个 人 都 相互 独立 地 过 我 们 的 生活 我 在 游泳 的 时 候 你 可 以 看 球 


赛 ， 等 等 。 


1.1.1 计算 机 系统 中 的 并 发 


当 我 们 提 到 计算 机 术语 的 “并 发 >， 指 的 是 在 单个 系统 里 同时 执行 多 个 独立 的 
活动 ， 而 不 是 顺序 地 或 是 一 个 接 一 个 地 。 这 并 不 是 一 种 新 的 现象 ， 多 任务 操作 系 
统 通过 任务 切换 允许 一 全 计算 机 在 同一 时 间 运 行 多 个 应 用 程序 已 司空 见 惯 多 年 ， 
一 些 高 端的 多 任务 处 理 服 务 器 实现 并 发 控制 的 历史 更 久远 。 真 正 有 新 意 的 是 增加 
计算 机 真正 并 行 运行 多 任务 的 普遍 性 ， 而 不 只 是 给 人 这 种 错觉。 


以 前 ， 大 多 数 计算 机 都 有 一 个 处 理 器 ， 具 有 单个 处 理 单 元 或 核心 ， 至 今 许 多 
台式 机 器 仍 是 这 样 。 这 种 计算 机 在 某 一 时 刻 只 可 以 真正 执行 一 个 任务 ， 但 它 可 以 
每 秒 切换 任务 许多 次 。 通 过 做 一 点 这 个 任务 然后 再 做 一 点 别 的 任务 ， 看 起 来 像 是 
任务 在 并 行 发 生 。 这 就 是 任务 切换 Ctaskswitching) 。 我 们 仍然 将 这 样 的 系统 称 
为 并 发 〈concurrency) ， 因 为 任务 切换 得 太 快 ， 以 至 于 无 法 分 辨 任务 在 何 时 会 被 
暂 挂 而 切换 到 另 一 个 任务 。 任 务 切 换 给 用 户 和 应 用 程序 本 身 造成 了 一 种 并 发 的 假 
象 。 由 于 这 只 是 并 发 的 假象 ， 当 应 用 程序 执行 在 单 处 理 絮 任务 切换 环境 下 ， 与 在 
真正 的 并 发 环境 下 执行 相 比 ， 其 行为 还 是 有 着 微妙 的 不 同 。 特 别 地 ， 对 内 存 模型 
pcm a 0 
深入 讨论 。 


包含 多 个 处 理 器 的 计算 机 用 于 服务 器 和 融 性 能 计算 任务 已 有 多 年 ， 现 在 基于 
早 个 蕊 片上 具有 多 于 一 个 核心 的 处 理 占 (多 核心 处 理 器 〉 的 计算 机 也 成 为 越 来 越 
常见 的 台式 机 器 。 无 论 它们 拥有 多 个 处 理 器 或 一 个 多 核 处 理 器 (或 两 者 兼 具 )， 
这 些 计算 机 能 够 真正 的 并 行 运行 超过 一 个 任务 。 我 们 才 称 之 为 硬件 并 发 


(hardwareconcurrency) 。 


图 1.1 显 示 了 一 个 计算 机 处 理 恰好 两 个 任务 时 的 理想 情景 ， 每 个 任务 被 分 为 10 
个 相等 大 小 的 块 。 在 一 个 双核 机 器 (具有 两 个 处 理 核心 ) 中 ， 每 个 任务 可 以 在 各 
自 的 核心 执行 。 在 单 核 机 器 上 做 任务 切换 时 ， 每 个 任务 的 块 交 织 进行 。 但 它们 也 
隔 开 了 一 位 〈 图 中 所 示 灰 色 分 隔 条 的 厚度 大 于 双核 机 器 的 分 隔 条 ) 。 为 了 实现 交 
蔡 进 行 ， 该 系统 每 次 从 一 个 任务 切换 到 另 一 个 时 都 得 执行 一 次 上 下 文 切换 
(contextswitch) ， 而 这 是 需要 时 间 的 。 为 了 执行 上 下 文 切 换 ， 操 作 系 统 必 须 为 
当前 运行 的 任务 保存 CPU 的 状态 和 指令 指针 ， 算 出 要 切换 到 哪个 任务 ， 并 为 要 切 
换 到 的 任务 重新 加 载 处理 器 状态 。 然 后 CPU 可 能 要 将 新 任务 的 指令 和 数据 的 内 存 
载 入 到 缓存 中 ， 这 可 能 会 阻止 CPU 执行 任何 指令 ， 造 成 进一步 的 延迟 。 


图 1.1 并 发 的 两 种 方式 ， 双 核 机 器 的 并 行 执行 对 比 单 核 机 器 的 任务 切换 


尽管 硬件 并 发 的 可 用 性 在 多 处 理 器 或 多 核 系统 上 更 显著 ， 有 些 处 理 器 却 可 以 
在 一 个 核心 上 执行 多 个 线程 。 要 考虑 的 最 重要 的 因素 是 硬件 线程 
(hardwarethreads) 的 数量 : 即 硬件 可 以 真正 并 发 运行 多 少 独立 的 任务 。 即 便 是 
具有 真正 硬件 并 发 的 系统 ， 也 很 容易 有 超过 硬件 可 并 行 运行 的 任务 要 执行 ， 所 以 
在 这 些 情 况 下 任务 切换 仍 将 被 使 有 用。 例如， 在 一 个 典型 的 台式 计算 机 上 可 能 会 有 
几 百 个 的 任务 在 运行 ， 执 行 后 台 操 作 ， 即 使 计算 机 在 名 义 上 是 空闲 的 。 正 是 任务 
切换 使 得 这 些 后 台 任 务 可 以 运行 ， 并 使 得 你 可 以 同时 运行 文字 处 理 器 、 编 译 器 、 
编辑 器 和 web 浏 览 器 (或 任何 应 用 的 组 合 )。 图 1.2 显 示 了 四 个 任务 在 一 台 双 核 机 
器 上 的 任务 切换 ， 仍 然 是 将 任务 整齐 地 划分 为 同等 大 小 块 的 理想 情况 。 实 际 上 ， 
许多 因素 造成 了 分 割 不 均 和 调度 不 规则 。 这 些 因素 中 的 一 部 分 将 涵盖 在 第 8 章 
中 ， 那 时 我 们 再 来 看 一 看 影响 并 行 代码 性 能 的 因素 。 


Im 


图 1.2 ”四 个 任务 在 两 个 核心 之 间 的 切换 
所 有 的 技术 、 功 能 和 本 书 所 涉及 的 类 都 可 以 使 用 ， 无 论 你 的 应 用 程序 是 在 单 


核 处 理 器 还 是 多 核 处 理 占 上 运行 ， 也 不 管 是 任务 切换 或 是 真正 的 硬件 并 发 。 但 你 
可 以 想象 ， 如 何在 你 的 应 用 程序 中 使 用 并 发 很 大 程度 上 取决 于 可 用 的 硬件 并 友 。 
这 将 在 第 8 章 中 涵盖 ， 在 第 8 章 我 们 具体 研究 C++ 代码 并 行 设计 问题 。 


1.1.2 并 发 的 途径 


想象 一 下 两 个 程序 员 一 起 做 一 个 软件 项 目 。 如 果 你 的 开发 人 员 在 独立 的 办 公 
室 ， 它 们 可 以 各 自 平 静 地 工作 ， 而 不 会 互相 干扰 ， 并 且 他 们 各 有 自己 的 一 套 参 考 


手册 。 然 而 ， 沟 通 起 来 就 不 那么 直接 了 ;不 能 转身 然后 互相 交谈 ， 他 们 必须 用 电 
话 、 电 子 邮件 或 走 到 对 方 的 办 公 室 。 同 时 ， 你 需要 掌控 两 个 办 公 室 的 开销 ， 还 要 
购买 多 份 参考 手册 。 


现在 想象 一 下 把 开发 人 员 移 到 同一 间 办 公 室 。 他 们 现在 可 以 地 相互 交谈 来 讨 
论 应 用 程序 的 设计 ， 他 们 也 可 以 很 容易 地 用 纸 或 白板 来 绘制 图 表 ， 辅 助 阐释 设计 
思路 。 你 现在 只 有 一 个 办 公 室 要 管理 ， 只 要 一 组 资源 就 可 以 满足 。 消 极 的 一 面 
是 ， 他 们 可 能 会 发 现 难以 集中 注意 力 ， 并 且 还 可 能 存在 资源 共享 的 问题 (“参考 手 
册 跑 哪 去 了 ? ”) 。 


组 织 开 发 人 员 的 这 两 种 方法 代表 着 并 发 的 两 种 基本 途径 。 每 个 开 及 人 员 代 表 
一 个 线程 ， 每 个 办 公 室 代表 一 个 处 理 器 。 第 一 种 途径 是 有 多 个 单线 程 的 进程 ， 这 
就 类 似 让 每 个 开发 人 员 在 他 们 自己 的 办 公 室 ， 而 第 二 种 途径 是 在 单一 进程 里 有 多 
个 线程 ， 这 就 类 似 在 同一 个 办 公 室 里 有 两 个 开发 人 员 。 你 可 以 随意 进行 组 合 ， 并 
且 拥有 多 个 进程 ， 其 中 一 些 是 多 线程 的 ， 一 些 是 单线 程 的 ， 但 原理 是 一 样 的 。 让 
我 们 在 一 个 应 用 程序 中 简要 地 看 一 看 这 两 种 途径 。 


1. 多 进程 并 发 


在 一 个 应 用 程序 中 使 用 并 发 的 第 一 种 方法 ， 是 将 应 用 程序 分 为 多 个 、 独 立 
的 、 单 线程 的 进程 ， 它 们 运行 在 同一 时 刻 ， 就 像 你 可 以 同时 进行 网 页 浏览 和 文字 
处 理 。 这 些 独 立 的 进程 可 以 通过 所 有 常规 的 进程 间 通 信 渠 道 互相 传递 信息 〈 信 
号 、 套 接 字 、 文 件 、 管 道 等 ) ， 如 图 1.3 所 示 。 有 一 个 缺点 是 这 种 进程 之 间 的 通信 
通常 设置 复杂 ， 或 是 速度 较 慢 ， 或 两 者 兼备 ， 因 为 操作 系统 通常 在 进程 间 提 供 了 
大 量 的 保护 ， 以 避免 一 个 进程 不 小 心 修改 了 属于 男 一 个 进程 的 数据 。 男 一 个 缺点 
是 运行 多 个 进程 所 需 的 固有 的 开销 : 启动 进程 需要 时 间 ， 操 作 系 统 必须 投入 内 部 


资源 来 管理 进程 ， 等 等 。 


进程 间 通 信 


操作 系统 


图 1.3 一 对 并 发 运行 的 进程 之 间 的 通信 


当然 ， 也 并 不 全 是 缺点 : 操作 系统 在 线程 间 提 供 的 附加 保护 操作 和 更 高 级 别 
的 通信 机 制 ， 意 味 着 可 以 比 线程 更 容易 地 编写 安全 的 并 发 代码 。 事 实 上 ， 类 似 于 
为 Erlang 编 程 语言 提供 的 环境 ， 可 使 用 进程 作为 重大 作用 并 发 的 基本 构造 块 。 


使 用 独立 的 进程 实现 并 发 还 有 一 个 额外 的 优势 一 一 你 可 以 通过 网 络 连接 的 不 
同 的 机 器 上 运行 独立 的 进程 。 虽 然 这 增加 了 通信 成 本 ， 但 在 一 个 精心 设计 的 系统 
上 上， 它 可 能 是 一 个 提高 并 行 可 用 行 和 提 融 性 能 的 低 成 本 方法 。 


2. 多 线程 并 发 


并 发 的 男 一 个 途径 是 在 单个 进程 中 运行 多 个 线程 。 线 程 很 像 轻 量 级 的 进程 : 
每 个 线程 相互 独立 运行 ， 且 每 个 线程 可 以 运行 不 同 的 指令 序列 。 但 进程 中 的 所 有 
线程 都 共享 相同 的 地 址 空间 ， 并 且 从 所 有 线程 中 访问 到 大 部 分 数据 一 一 全 局 变量 
仍然 是 全 局 的 ， 指 针 、 对 象 的 引用 或 数据 可 以 在 线程 之 间 传 递 。 虽 然 通 常 可 以 在 
进程 之 间 共 享 内 存 ， 但 这 难以 建立 并 且 通 第 难以 管理 ， 因 为 同一 数据 的 内 存 地 址 
fee te nee een erat ie 
行 通 信 。 


A AE 


图 1.4 同一 进程 中 的 一 对 并 发 运行 的 线程 之 间 的 通信 
共 于 的 地 址 空间 ， 以 及 缺少 线程 间 的 数据 保护 ， 使 得 使 用 多 线程 相关 的 开销 


远 小 于 使 用 多 进程 ， 因 为 操作 系统 有 更 少 的 夭 记 要 做 。 但 是 ， 共 享 内 存 的 灵活 性 
是 有 代价 的 :如果 数据 要 被 多 个 线程 访问 ， 那 么 程序 员 必 须 确保 当 每 个 线程 访问 
时 所 看 到 的 数据 是 一 致 的 。 线 程 间 数 据 共享 可 能 会 遇 到 的 问题 、 所 使 用 的 工具 以 
及 为 了 避免 问题 而 要 遵循 的 准则 在 本 书 中 都 有 涉及 ， 特 别 是 在 第 3、4、5 和 8 草 

中 。 这 些 问题 并 非 不 能 克服 ， 只 要 在 编写 代码 时 适当 地 注意 即 可 ， 但 这 却 意味 大 
必须 对 线程 之 间 的 通信 作 大 量 的 思考 。 


相 比 于 局 动 多 个 单线 程 进程 并 在 其 间 进 行 通信 ， 启 动 单一 进程 中 的 多 线程 并 
在 其 间 进 行 通信 的 开销 更 低 ， 这 意味 着 知 不 考虑 共享 内 存 可 能 会 带 来 的 潜在 问 
题 ， 它 是 包括 C++ 在 内 的 主流 语言 更 青睐 的 并 发 途径 。 此 外 ，C++ 标 准 没 有 为 进 
程 间 通 信和 提供 任何 原生 支持 ， 所 以 使 用 多 进程 的 应 用 程序 将 不 得 不 依赖 平台 相关 
的 API 来 实现 。 因 此 ， 本 书 专 门 关注 使 用 多 线程 的 并 友 ， 并 且 之 后 提 到 并 发 均 是 
假定 通过 使 用 多 线程 来 实现 的 。 


明确 了 什么 是 并 发 后 ， 现 在 让 我 们 来 看 看 为 什么 要 在 应 用 程序 中 使 用 并 发 。 


1.2 ”为 什么 使 用 并 发 


在 应 用 程序 中 使 用 并 发 的 原因 主要 有 两 个 : 关注 点 分 离 和 性 能 。 事 实 上 ， 我 
甚至 可 以 说 它们 差不多 是 使 用 并 发 的 唯一 原因 : 当 你 观察 得 足够 仔细 时 ， 一 切 其 
他 因 系 都 可 以 归结 到 这 两 者 之 一 《或 者 可 能 是 二 者 兼 有 ， 当 然 ， 除 了 像 " 我 原 
意 ” 这 样 的 原因 之 外 ) 。 


1.2.1 为 了 划分 关注 点 而 使 用 并 发 


在 编写 软件 时 ， 划 分 关注 点 总 是 个 好 主意 。 通 过 将 相关 的 代码 放 在 一 起 并 将 
无 关 的 代码 分 开 ， 这 种 方法 可 以 使 你 的 程序 更 容易 理解 和 测试 ， 从 而 减少 出 错 的 
可 能 性 。 你 可 以 使 用 并 发 来 分 隔 不 同 的 功能 区 域 ， 即 使 在 这 些 不 同 功能 区 域 的 操 
作 需 要 在 同一 时 刻 发 生 的 情况 下 。 如 果 不 显 式 地 使 用 并 发 ， 你 要 么 被 迫 编写 任务 
切换 框架 ， 要 么 在 操作 中 主动 地 调用 不 相关 的 一 段 代 码 。 


考虑 一 类 带 有 用 户 界 面 的 密集 处 理 型 应 用 程序 ， 例 如 为 台式 计算 机 提供 的 
DVD 播 放 程 序 。 这 样 一 个 应 用 程序 基本 上 具备 两 套 职能 : 它 不 仅 要 从 光盘 中 读 取 
数据 ， 解 码 图 像 和 声音 ， 并 把 它们 及 时 输出 至 视频 和 音频 硬件 ， 从 而 实现 DVD 的 
无 错 播放 ; 它 还 要 接受 来 自用 户 的 输入 ， 例 如 当 用 户 单 击 暂 停 或 返回 菜单 甚至 退 
出 按键 的 情况 。 在 单个 线程 中 ， 应 用 程序 须 在 回放 期 间 定 期 检查 用 户 的 输入 ， 于 
是 将 DVD 回 放 代 码 和 用 户 界面 代码 合 在 一 起 。 通 过 使 用 多 线程 来 分 隔 这 些 关 注 
护 ， 用 户 界 面 代码 和 DVD 回 放 代 码 不 再 需要 如 此 紧密 地 交织 在 一 起 。 一 个 线程 可 
以 处 理 用 户 界面 ， 男 一 个 处 理 DVD 回 放 ， 它 们 之 间 会 有 交互 ， 例 如 用 户 点 击 暂 
停 ,， 但 现在 这 些 交 互 直接 与 眼前 的 任务 有 关 。 


这 会 币 来 啊 应 性 的 错觉 ， 因 为 用 户 界 面 线 程 通常 可 以 立即 响应 用 户 的 请 求 ， 
即使 在 请 求 被 传达 给 工作 的 线程 ， 啊 应 为 简单 地 显示 正 忙 的 光标 或 请 等 待 的 消息 
的 情况 。 类 似 地 ， 独 立 的 线程 常 被 用 于 运行 必须 在 后 台 连 续 运 行 的 任务 ， 例 如 在 
桌面 搜索 程序 中 监视 文件 系统 的 变化 。 以 这 种 方式 使 用 线程 一 般 会 使 每 个 线程 的 
逻辑 更 加 简单 ， 因 为 它们 之 间 的 交互 可 以 被 限制 为 清晰 可 辩 的 点 ， 而 不 是 到 处 散 
播 不 同 任务 的 逻辑 。 


在 这 种 情况 下 ， 线 程 的 数量 与 CPU 可 用 内 核 的 数量 无 关 ， 因 为 对 线程 的 划分 
是 基于 概念 上 的 设计 而 不 是 试图 增加 吞吐 量 。 


12.2 为 了 性 能 而 使 用 并 发 


多 处 理 器 系统 已 经 存在 了 几 十 年 ， 但 直到 最 近 ， 他 们 几乎 只 能 在 超级 计算 
机 、 大 型 机 和 大 型 服务 器 系统 中 才能 看 到 。 然 而 心 片 制造 商 越 来 越 倾 癌 于 多 核 必 
片 的 设计 ， 即 在 单个 芯片 上 集成 2、4、16 或 更 多 的 处 理 器 ， 从 而 达到 比 单 核心 更 


好 的 性 能 。 因 此 ， 多 核 台 式 计算 机 ， 甚 至 多 核 谋 入 式 设备 ， 现 在 越 来 越 普遍 。 这 
些 计算 机 的 计算 能 力 的 提高 不 是 源 自 使 单一 任务 运行 的 更 快 ， 而 是 源 自 并 行 运行 
多 个 任务 。 在 过 去 ， 程 序 员 曾 坐等 他 们 的 程序 随 着 处 理 器 的 更 新 换代 而 变 得 更 

快 ， 无 需 他 们 这 边 做 出 任何 努力 。 但 是 现在 ， 就 像 Herb Sutter 所 说 的 ，“ 免 费 的 午 
餐 结束 了 [1”。 如 果 软 件 想 要 利用 日 益 增长 的 计算 能 力 ， 它 必须 设计 为 并 发 运行 
多 个 任务 。 程 序 员 因此 必须 留意 ， 而 且 那些 迄今 都 忽略 并 发 的 人 们 必须 注意 它 并 
将 其 加 入 他 们 的 工具 箱 中 。 


有 两 种 方式 为 了 性 能 使 用 并 发 。 首 先 ， 也 是 最 明显 的 ， 是 将 一 个 单个 任务 分 
成 几 部 分 且 各 自 并 行 运行 ， 从 而 降低 总 运行 时 间 ， 这 就 是 任务 并 行 
(taskparallelism) 。 虽 然 这 听 起 来 很 直观 ， 但 它 可 以 是 一 个 相当 复杂 的 过 程 ， 
因为 在 各 个 部 分 之 间 可 能 存在 很 多 的 依赖 。 区 别 可 能 是 在 过 程 方面 一 一 一 个 线程 
执行 算法 的 一 部 分 而 另 一 个 线程 执行 算法 的 另 一 部 分 一 一 或 是 在 数据 方面 一 一 每 
个 线程 在 不 同 的 数据 部 分 上 执行 相同 的 操作 。 后 一 种 方法 被 称 为 数据 并 行 


(dataparallelism) 。 


容易 受 这 种 并 行 影响 的 算法 常 被 称 为 易 并 行 (embarrassinglyparallel) 。 抛 
开 你 可 能 会 尴 从 地面 对 的 很 容易 并 行 化 的 代码 这 一 含义 ， 这 是 一 件 好 事情 。 我 曾 
遇 到 过 的 关于 此 算法 的 别 的 术语 是 自然 并 行 Cnaturallyparallel) 和 便利 并 发 
(convenientlyconcurrent) 。 易 并 行 算法 具有 良好 的 可 扩展 特性 一 一 随 着 可 用 硬 
件 线程 数量 的 提升 ， 算 法 的 并 行 性 可 以 随 之 增加 与 之 匹配 。 这 样 的 一 个 算法 是 谚 
语 “< 人 多 力量 大 ”的 完美 体现 。 对 于 非 易 并 行 算法 的 那 一 部 分 ， 你 可 以 将 算法 划分 
E 
ERBER. 


使 用 并 发 来 提升 性 能 的 第 二 种 方法 是 使 用 可 用 的 并 行 方式 来 解决 更 大 的 问 
题 。 与 其 同时 处 理 一 个 文件 ， 不 如 酌情 处 理 2 个 或 10 个 或 20 个 。 虽 然 这 实际 上 只 
是 数据 并 行 的 一 种 应 用 ， 通 过 对 多 组 数据 同时 执行 相同 的 操作 ， 但 还 是 有 不 同 的 
重点 。 处 理 一 个 数据 块 仍然 需要 同样 的 时 间 ， 但 在 相同 的 时 间 内 却 可 以 处 理 更 多 
的 数据 。 当 然 ， 这 种 方法 也 存在 限制 ， 且 并 非 在 所 有 情况 下 都 是 有 益 的 ， 但 是 这 
种 方法 所 禹 来 的 否 吐 量 提 升 可 以 让 一 些 新 玩意 变 得 可 能 。 例 如 ， 如 果 图 片 的 各 部 
分 可 以 并 行 处 理 ， 就 能 提高 视频 处 理 的 分 辨 率 。 


1.2.3 ”什么 时 候 不 使 用 并 发 


知道 何 时 不 使 用 并 发 与 知道 何 时 要 使 用 它 同等 重要 。 基 本 上 ， 不 使 用 并 发 的 
唯一 原因 就 是 在 收益 比 不 上 成 本 的 时 候 。 使 用 并 发 的 代码 在 很 多 情况 下 难以 理 
解 ， 因 此 编写 和 维护 的 多 线程 代码 就 有 直接 的 脑力 成 本 ， 同 时 额外 的 复杂 性 也 可 
能 导致 更 多 的 错误 。 除 非 潜在 的 性 能 增益 足够 大 或 关注 点 分 离 得 足够 清晰 ， 能 抵 
消 确保 其 正确 所 需 的 额外 的 开发 时 间 以 及 与 维护 多 线程 代码 相关 的 额外 成 本 ， 人 否 
则 不 要 使 用 并 发 。 


同样 地 ， 性 能 增益 可 能 不 会 如 预期 的 那么 大 。 在 局 动 线程 时 存在 固有 的 开 


销 ， 因 为 操作 系统 必须 分 配 相关 的 内 核资 源 和 堆栈 空间 ， 然 后 将 新 线程 加 入 调度 
器 中 ， 所 有 这 一 切 都 要 占用 时 间 。 如 果 在 线程 上 运行 的 任务 完成 得 很 快 ， 那 么 任 
务实 际 上 占据 的 时 间 与 启动 线程 的 开销 时 间 相 比 就 显得 微不足道 ， 可 能 会 导致 应 
用 程序 的 整体 性 能 还 不 如 通过 产生 线程 直接 执行 该 任务 。 


此 外 ， 线 程 是 有 限 的 资源 。 如 果 让 太 多 的 线程 同时 运行 ， 则 会 消耗 操作 系统 
资源 ， 并 且 使 得 操作 系统 整体 上 运行 得 更 缓慢 。 不 仅 如 此 ， 运 行 太 多 的 线程 会 耗 
尽 进程 的 可 用 内 存 或 地 址 空间 ， 因 为 每 个 线程 都 需要 一 个 独立 的 堆栈 空间 。 对 于 
一 个 可 用 地 址 空间 限制 为 4GB 的 忆 平 架构 的 32 位 进程 来 说 ， 这 尤其 是 个 问题 。 如 
果 每 个 线程 都 有 一 个 1MB 的 堆栈 (对 于 很 多 系统 来 说 是 典型 的 ) ， 那 么 4096 个 线 
程 将 会 用 尽 所 有 地 址 空间 ， 不 再 为 代码 、 静 态 数 据 或 者 堆 数据 留 有 空间 。 虽 然 64 
位 (或 者 更 大 ) 的 系统 不 存在 这 种 直接 的 地 址 空间 限制 ， 它 们 仍然 只 具备 有 限 的 
资源 ;如果 你 运行 太 多 的 线程 ， 最 终 会 导致 问题 。 尽 管线 程 池 《参见 第 9 章 ) 可 
以 用 来 限制 线程 的 数量 ， 但 这 并 不 是 灵丹妙药 ， 它 们 也 有 上 自己 的 问题 。 


如 果 客 户 端 /服务 器 应 用 程序 的 服务 器 问 为 每 一 个 链接 局 动 一 个 独立 的 线程 ， 
对 于 少量 的 链接 是 可 以 正常 工作 的 ， 但 当 同 样 的 技术 用 于 需要 处 理 大 量 链接 的 高 
需求 服务 器 时 ， 就 会 因为 启动 太 多 线程 而 迅速 耗 尽 系统 资源 。 在 这 种 场景 下 ， 说 
慎 地 使 用 线程 池 可 以 提供 优化 的 性 能 《参见 第 9 章 ) 。 


最 后 ， 运 行 越 多 的 线程 ， 操 作 系统 就 需要 做 越 多 的 上 下 文 切换 。 每 个 上 下 文 
切换 都 需要 耗费 本 可 以 花 在 有 价值 工作 上 的 时 间 ， 上 所 以 在 茶 些 时 候 ， 增 加 一 个 额 
外 的 线程 实际 上 会 降低 而 不 是 提高 应 用 程序 的 整体 性 能 。 为 此 ， 如 果 你 试图 得 到 
系统 的 最 佳 性 能 ， 考 虑 可 用 的 硬件 并 发 〈 或 缺乏 之 ) 并 调整 运行 线程 的 数量 是 必 


需 的 。 


为 了 性 能 优化 而 使 用 并 发 就 像 所 有 其 他 优化 策略 一 样 ， 它 拥有 极 大 提高 应 用 
程序 性 能 的 潜力 ， 但 它 也 可 能 使 代码 复杂 化 ， 使 其 更 难 理解 和 更 容易 出 错 。 因 
此 ， 只 有 对 应 用 程序 中 的 那些 具有 显著 增益 潜力 的 性 能 关键 部 分 才 值 得 这 样 做 。 
当然 ， 如 果 性 能 收益 的 潜力 仅 次 于 设计 清晰 或 关注 点 分 离 ， 可 能 也 值得 使 用 多 线 


程 设计 。 


”假设 你 已 经 决定 确实 要 在 应 用 程序 中 使 用 并 发 ， 无 论 是 为 了 性 能 、 关 注 点 分 
离 ， 或 是 因为 “多 线程 星期 一 ”， 对 于 C++ 程序 员 来 说 意味 着 什么 ? 


1.3 在 C++ 中 使 用 并 及 和 多 线程 


通过 多 线程 为 并 发 提供 标准 化 的 支持 对 C++ 来 说 是 新 鲜 事 物 。 只 有 在 即将 到 
来 的 Ct+11 标 准 中 ， 你 才能 不 依赖 平台 相关 的 扩展 来 编写 多 线程 代码 。 为 了 理解 
新 版 本 C++ 线 程 库 中 众多 规则 背后 的 基本 原理 ， 了 解 其 历史 是 很 重要 的 。 


1.3.1 C++ 多 线程 历程 


1998C++ 标 准 版 不 承认 线程 的 存在 ， 并 且 各 种 语言 要 系 的 操作 效果 都 以 顺序 
抽象 机 的 形式 编写 。 不 仅 如 此 ， 内 存 模型 也 没有 被 正式 定义 ， 所 以 对 于 1998 
C++ 标准 ， 你 没 办 法 在 缺少 编译 器 相关 扩展 的 情况 下 编写 多 线程 应 用 程序 。 


当然 ， 编 译 器 供应 商 可 以 自由 地 向 语言 添加 扩展 ， 并 且 针 对 多 线程 的 C API 
的 流行 例如 在 POSIX C 和 Microsoft Windows API 中 的 那些 一 导致 很 多 
C++ 编译 器 供应 商 通 过 各 种 平台 相关 的 扩展 来 支持 多 线程 。 这 种 编译 器 支持 普遍 
地 受 限 于 只 允许 使 用 该 平台 相应 的 C API 以 及 确保 该 C++ 运行 时 库 〈 例 如 异常 处 理 
机 制 的 代码 ) 在 多 线程 存在 的 情况 下 运行 。 尽 管 极 少 有 编译 器 供应 商 提 供 了 一 个 
正式 的 多 线程 感知 内 存 模型 ， 但 编译 器 和 处 理 器 的 实际 表现 也 已 经 足够 好 ， 以 至 
于 大 量 的 多 线程 的 C++ 程序 已 被 编写 出 来 。 


由 于 不 满足 于 使 用 平台 相关 的 C API 来 处 理 多 线程 ，C++ 程 序 员 曾 期 望 他 们 的 
类 库 提 供 面向 对 象 的 多 线程 工具 。 像 MFC 这 样 的 应 用 程序 框架 ， 以 及 像 Boost 和 
ACE 这 样 的 C++ 通用 类 库 曾 积累 了 多 套 C++ 类 ， 封 装 了 下 层 的 平台 相关 API 并 提供 
高 级 的 多 线程 工具 以 简化 任务 。 各 类 库 的 具体 细节 ， 特 别 是 在 启动 新 线程 的 方 
面 ， 存 在 很 大 差异 ， 但 是 这 些 类 的 总 体 构造 存在 很 多 共通 之 处 。 有 一 个 为 许多 
C++ 类 库 共 有 的 ， 同 时 也 是 为 程序 员 提 供 很 大 便利 的 特别 重要 的 设计 ， 就 是 市 锁 
的 资源 获得 即 初 始 化 CRAIIT ResourceAcquisitionIsInitialization) 的 习惯 用 法 ， 
来 确保 当 退 出 相关 作用 域 的 时 候 互 斥 元 被 解锁 。 


许多 情况 下 ， 现 有 的 C++ 编译 器 所 提供 的 多 线程 文 持 ， 例 如 Boost 和 ACE， 纤 
合 了 平台 相关 API 以 及 平台 无 关 类 库 的 可 用 性 ， 为 编写 多 线程 C++ 代码 提供 一 个 坚 
实 的 基础 ， 也 因此 大 约 有 数 百 万 行 C++ 人 代码 作为 多 线程 应 用 程序 的 一 部 分 而 被 编 
写 出 来 。 但 缺乏 标准 的 支持 ， 意 味 着 存在 缺少 线程 感知 内 存 模型 从 而 导致 问题 的 
场合 ， 特 别 是 对 于 那些 试图 通过 使 用 处 理 器 硬件 能 力 来 获取 更 高 性 能 ， 或 是 编写 
跨 平 台 代 码 ， 但 是 在 不 同 平台 之 间 编 译 器 的 实际 表现 存在 差异 。 


1.3.2 ”新 标准 中 的 并 发文 持 


所 有 这 些 都 随 着 新 的 C++11 标 准 的 发 布 而 改变 了 。 不 仅 有 了 一 个 全 新 的 线程 
感知 内 存 模型 ，C++ 标 准 库 也 被 扩展 了 ， 包 含 了 用 于 管理 线程 (参见 第 2 章 ) 、 保 


护 共 部 数据 《参见 第 3 章 ) 、 线 程 间 同步 操作 《参见 第 4 章 ) 以 及 低级 原子 操作 
《参见 第 5 章 ) 的 各 个 类 。 


新 的 C++ 线程 库 很 大 程度 上 基于 之 前 通过 使 用 上 文 提 到 的 C++ 类 库 而 积累 的 
经 验 。 特 别 地 ，Boost 线 程 库 被 用 作 新 类 库 所 基于 的 主要 模型 ， 很 多 类 与 Boost 中 
的 对 应 者 共享 命名 和 结构 。 在 新 标准 演进 的 过 程 中 ， 这 是 个 双 辐 流动，Boost 线 程 
库 也 改变 了 自己 ， 以 便 在 多 个 方面 匹配 C++ 标准 ， 因 此 从 Boost 迁 移 过 来 的 用 户 将 
会 发 现 自己 非常 适应 。 


正如 本 章 开 篇 提 到 的 那样 ， 对 并 发 的 支持 仅仅 是 新 C++ 标准 的 变化 之 一 ， 此 
外 还 存在 很 多 对 于 编程 语言 自身 的 改善 ， 可 以 使 得 程序 员 们 的 工作 更 便捷 。 这 些 
内 容 虽 然 不 在 本 书 的 论述 范围 之 内 ， 但 是 其 中 的 一 些 变 化 对 于 线程 库 本 里 及 其 使 
用 方式 已 经 形成 了 直接 的 冲击 。 附 录 A 对 这 些 语言 特性 做 了 简要 的 介绍 。 


C++ 中 对 原子 操作 的 直接 支持 ， 允 许 程序 员 编 写 具 有 确定 语义 的 高 效 代 码 ， 
而 无 需 平台 相关 的 汇编 语言 。 这 对 于 那些 试图 编写 高 效 的 、 可 移植 代码 的 程序 员 
们 来 说 是 一 个 真正 的 福利 。 不 仪 有 编译 器 可 以 搞定 平台 的 具体 内 容 ， 还 可 以 编写 
优化 器 来 考虑 操作 的 语义 ， 从 而 让 程序 作为 一 个 整体 得 到 更 好 的 优化 。 


1.3.3 ”C++ 线程 库 的 效率 


对 于 C++ 整体 以 及 包含 低级 工具 的 C++ 类 一 一 特别 是 在 新 版 C++ 线程 库 里 的 那 
些 ， 参 与 高 性 能 计算 的 开发 者 常常 关注 的 一 点 就 是 效率 。 如 果 你 正 寻 求 极 致 的 性 
能 ， 那 么 理解 与 直接 使 用 底层 的 低级 工具 相 比 ， 使 用 高 级 工具 所 和 带 来 的 实现 成 
本 ， 是 很 重要 的 。 这 个 成 本 就 是 抽象 惩 训 Cabstractionpenalty) 。 


C++ 标准 委员 会 在 整体 设计 C++ 标准 库 以 及 专门 设计 标准 C++ 线程 库 的 时 候 ， 
就 已 经 十 分 注重 这 一 点 了 。 其 设计 的 目标 之 一 就 是 在 提供 相同 的 工具 时 ， 通 过 直 
接 使 用 低级 API 束 几乎 或 完全 得 不 到 任何 好 处 。 因 此 该 类 库 被 设计 为 在 大 部 分 平 
台 上 都 能 高 效 实现 〈 带 有 非常 低 的 抽象 惩罚 ) o 


C++ 标准 委员 会 的 另 一 个 目标 ， 是 确保 C++ 能 提供 足够 的 低级 工具 给 那些 硕 
望 与 硬件 工作 得 更 紧密 的 程序 员 ， 以 获取 终极 性 能 。 为 了 达到 这 个 目的 ， 伴 随 着 
新 的 内 存 模 型 ， 出 现 了 一 个 全 面 的 原子 操作 库 ， 用 于 直接 控制 单个 位 、 字 三 、 线 
程 间 同 步 以 及 所 有 变化 的 可 见 性 。 这 些 原子 类 型 和 相应 的 操作 现在 可 以 在 很 多 地 
方 加 以 使 用 ， 而 这 些 地 方 以 前 通 向 被 开发 者 选择 下 放 到 平台 相关 的 汇编 语言 中 。 
使 用 了 新 的 标准 类 型 和 操作 的 代码 因而 具有 更 佳 的 可 移植 性 ， 并 且 更 易于 维护 。 


C++ 标准 库 也 提供 了 更 高 级 别 的 抽象 和 工具 ， 它 们 使 得 编写 多 线程 代码 更 简 
单 和 不 易 出 错 。 有 时 候 运 用 这 些 工 具 确实 会 带 来 性 能 成 本 ， 因 为 必须 执行 额外 的 
代码 。 但 是 这 种 性 能 成 本 并 不 一 定 意 味 着 更 高 的 抽象 惩罚 ;总 体 来 看 ， 这 种 性 能 
成 本 并 不 比 通过 手工 编写 等 效 的 函数 而 招致 的 成 本 更 高 ， 同 时 编译 器 可 能 会 很 好 
地 内 联 大 部 分 额外 的 代码 。 


在 茶 些 情况 下 ， 高 级 工具 提供 超出 特定 使 用 需求 的 额外 功能 。 在 大 部 分 情况 
下 这 都 不 是 问题 ， 你 没有 为 你 不 使 用 的 那 部 分 买单 。 在 罕见 的 情况 下 ， 这 些 未 使 
用 的 功能 会 影响 其 他 代码 的 性 能 。 如 果 你 更 看 重 程序 的 性 能 ， 且 代价 过 高 ， 你 可 
能 最 好 是 通过 较 低 级 别 的 工具 来 手工 实现 需要 的 功能 。 在 绝 大 多 数 情况 下 ， 额 外 
增加 的 复杂 性 和 出 错 的 几率 远大 于 小 小 的 性 能 提升 所 带 来 的 潜在 收益 。 即 使 有 证 
据 确 实 表 明 瓶 宽 出 现在 C++ 标准 库 的 工具 中 ， 这 也 可 能 归咎 于 低劣 的 应 用 程序 设 
计 而 非 低劣 的 类 库 实 现 。 例 如 ， 如 果 过 多 的 线程 竞争 一 个 互 斥 元 ， 这 将 会 显著 影 
啊 性 能 。 与 其 试图 在 互 斥 操作 上 花 掉 一 点 点 的 时 间 ， 还 不 如 重新 构造 应 用 程序 以 
0 
述 。 


在 非常 罕见 的 情况 下 ，C++ 标 准 库 不 提供 所 需 的 性 能 或 行为 ， 这 时 则 有 必要 
运用 特定 的 平台 相关 的 工具 。 


1.3.4 平台 相关 的 工具 


虽然 C++ 线程 库 为 多 线程 和 并 发 处 理 提供 了 颇 为 全 面 的 工具 ， 但 是 在 所 有 的 
平台 上 ， 都 会 有 些 额外 的 平台 相关 工具 。 为 了 能 方便 地 访问 那些 工具 而 又 不 用 放 
茎 使 用 标准 C++ 线 程 库 带 来 的 好 处 ，C++ 线 程 库 中 的 类 型 可 以 提供 一 
个 native_handle() 成 员 函 数 ， 多 许 通 过 使 用 平台 相关 API 直 接 操作 底层 实现 。 
就 其 本 质 而 言 ， 任 何 使 用 native_handle() 执 行 的 操作 是 完全 依赖 于 平台 的 ， 这 
也 超出 了 本 书 ( 同 时 也 是 标准 C++ 库 本 里 ) 的 范围 。 


当然 ， 在 考虑 使 用 平台 相关 的 工具 之 前 ， 明 白 标准 库 能 够 提供 什么 是 很 重要 
的 ， 那 么 让 我 们 通过 一 个 例子 来 开始 。 


14 ”开始 入 门 


好 ， 现 在 你 有 一 个 很 棒 的 与 C++11 兼 容 的 编译 器 。 接 下 来 呢 ? 一 个 多 线程 
C++ 程序 是 什么 样子 的 ? 它 看 上 去 和 其 他 所 有 C++ 程序 一 样 ， 通 常 是 变量 、 类 以 
及 函数 的 组 合 。 唯 一 真正 的 区 别 在 于 某 些 函数 可 以 并 发 运行 ， 所 以 你 需要 确保 共 
享 数据 的 并 发 访问 是 安全 的 ， 详 见 第 3 蕴 。 当 然 ， 为 了 并 发 地 运行 函数 ， 必 须 使 
用 特定 的 函数 以 及 对 象 来 管理 各 个 线程 。 


你 好 ， 并 发 世界 
让 我 们 从 一 个 经 典 的 例子 开始 : 一 个 打印 “Hello World.” 的 程序 。 一 个 非常 简 
i World 程 序 如 下 所 示 ， 当 我 们 谈 到 多 线程 时 ， 它 可 以 
为 一 个 基准 。 


#include <iostream> 


int main () 


{ 
} 


清单 1.1 这 个 程序 所 做 的 一 切 就 是 将 “Hello World” 写 进 标准 输出 流 。 让 我 们 将 
它 与 下 面 清单 所 示 的 简单 的 Hello, Concurrent World 程 序 做 个 比较 ， 它 启动 了 一 个 
独立 的 线程 来 显示 这 个 信息 。 


清单 1.1 一 个 简单 的 Hello,Concurrent World 程 序 


std::cout<<"Hello WorldMn"; 


#include <iostream> 


#include «thread» 0 
void hello() -© 
{ 
std::cout««"Hello Concurrent World\n"; 
} 
int main() 
{ 
std::thread t(hello);  «—€ 
t.join(); «0 
j 


第 一 个 区 别 是 增加 了 #include<thread>@。 在 标准 C++ 库 中 对 多 线程 支持 
的 声明 在 新 的 头 文 件 中 ， 用 于 管理 线程 的 函数 和 类 在 <thread> 中 声明 ， 而 那些 保 
护 共 享 数 据 的 函数 和 类 在 其 他 头 文件 中 声明 。 


其 次 ， 写 信息 的 代码 被 移动 到 了 一 个 独立 的 函数 中 人 全。 这 是 因为 每 个 线程 都 
必须 具有 一 个 初始 函数 (initialfunction) ， 新 线程 的 执行 在 这 里 开始 。 对 于 应 用 
程序 来 说 ， 初 始 线程 是 main()， 但 是 对 于 所 有 其 他 线程 ， 这 在 std: :thread 对 象 
的 构造 函数 中 指定 在 本 例 中 ， 被 命名 为 t@ 的 std: :thread 对 象 拥有 新 函 
数 hello( ) 作 为 其 初始 函数 。 


下 一 个 区 别 ， 与 直接 写 入 标准 输出 或 是 从 main( ) 调 用 hello() 不 同 ， 该 程序 
启动 了 一 个 全 新 的 线程 来 实现 ， 将 线程 数量 一 分 为 二 一 一 初始 线程 始 于 main( ) 而 
新 线程 始 于 hello()。 


在 新 的 线程 启动 之 后 人 @， 初 始 线 程 继续 执行 。 如 果 它 不 等 待 新 线程 结束 ， 它 
就 将 自 顾 上 自 地 继续 运行 到 main( ) 的 结束 ， 从 而 结束 程序 一 一 有 可 能 发 生 在 新 线程 
有 机 会 运行 之 前 。@ 这 里 调用 join( ) 的 原因 一 一 详 见 第 2 章 ， 这 会 导致 调用 线程 

(在 main() 中 ) 等 待 与 std: :thread 对 象 相 关联 的 线程 ， 即 这 个 例子 中 的 t。 


如 果 这 看 起 来 像 是 仅仅 为 了 将 一 条 信息 写 入 标准 输出 而 做 了 大 量 的 工作 ， 那 
么 它 确实 如 此 一 一 正如 上 文 1.2.3 节 所 描述 的 ， 一 般 来 说 并 不 值得 为 了 如 此 简单 的 
任务 而 使 用 多 线程 ， 尤 其 是 如 果 在 这 期 间 初 始 线程 无 所 事 事 。 在 本 书后 面 的 内 容 
中 ， 我 们 将 通过 实例 来 展示 在 哪些 情景 下 使 用 多 线程 可 以 获得 明确 的 收益 。 


1.5 小结 


在 本 章 中 ， 我 提 及 了 并 发 与 多 线程 的 含义 以 及 在 你 的 应 用 程序 中 为 什么 会 选 
择 使 用 (或 不 使 用 ) 它 。 我 还 提 及 了 多 线程 在 C++ 中 的 发 展 历程 ， 从 1998 标 准 中 
完全 缺乏 支持 ， 经 历 了 各 种 平台 相关 的 扩展 ， 再 到 新 的 C++11 标 准 中 具有 合适 的 
多 线程 文 持 。 该 文 持 到 来 的 正 是 时 候 ， 它 使 得 程序 员 们 可 以 利用 伴随 新 的 CPU 而 
带 来 的 更 加 强大 的 硬件 并 发 ， 因 为 世 片 制造 商 选择 了 以 多 核心 的 形式 使 得 更 多 任 
务 可 以 同时 执行 的 方式 来 增加 处 理 能 力 ， 而 不 是 增加 单个 核心 的 执行 速度 。 


在 1.4 节 中 的 示例 中 展示 了 C++ 标准 库 中 的 类 和 函数 有 多 么 的 简单 。 在 
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企 党 试 了 1.4 贡 的 示例 之 后 ， 是 时 候 看 看 更 多 实质 性 的 内 容 了 。 在 第 2 章 中 ， 
我 们 将 看 一 看 用 于 管理 线程 的 类 和 函数 。 


[1] The Free Lunch Is Over: A Fundamental Turn Toward Concurrency in Software, 
Herb Sutter, Dr. Dobb’s Journal, 30(3), March 2005. 
http://www. gotw.ca/publications/concurrency-ddj.htm 


第 2 章 ”管理 线程 
本 章 主 要 内 容 


e 启动 线程 ， 以 及 各 种 让 代码 在 新 线程 上 运行 的 方法 
e 等 待 线程 完成 并 让 和 它 上 自动 运行 
e. 唯一 地 标识 线程 


那么 ， 你 已 经 下 决心 为 你 的 应 用 程序 使 用 并 发 了 。 特 别 地 ， 你 决定 了 使 用 多 
线程 。 接 下 来 呢 ?” 如 何 启 动 这 些 线程 ， 怎 样 检查 它们 已 完成 ， 怎 样 监视 它们 呢 ? 
C++ 标 准 库 让 大 多 数 线程 管理 任务 变 得 相对 简单 ， 通 过 与 给 定 线 程 相关 联 的 
std: :thread 对 象 就 可 以 管理 所 有 事情 ， 如 你 将 要 看 到 的 那样 。 对 于 那些 并 不 直 
观 的 任务 ， 标 准 库 也 提供 了 从 基本 构建 块 进行 按 需 构建 的 可 扩展 性 。 


在 本 章 中 ， 我 将 从 基础 开始 曾 述 。 局 动 一 个 线程 ， 等 待 它 完成 ， 或 是 在 后 全 
运行 它 。 接 下 来 我 们 将 看 一 看 在 线程 函数 启动 时 问 其 传递 额外 的 参数 ， 以 及 如 何 
将 线程 的 所 有 权 从 一 个 std: :thread 对 象 转移 到 另 一 个 。 最 后 ， 我 们 会 看 一 看 选 
择 所 使 用 的 线程 数量 ， 以 及 标识 特定 的 线程 。 


2.1 基本 线程 官 理 


每 个 C++ 程序 都 拥有 至 少 一 个 线程 ， 它 是 由 C++ 在 运行 时 启动 的 ， 该 线程 运 
行 着 main() 函 数 。 你 的 程序 可 以 继续 启动 具有 其 他 函数 作为 入 口 的 线程 。 然 后 ， 
这 些 线程 连同 初始 线程 一 起 ， 并 发 运行 。 正 如 程序 会 在 main() 函 数 返 回 时 退出 那 
样 ， 当 指定 的 入 口 函 数 返 回 时 ， 该 线程 就 会 退出 。 如 你 所 见 ， 如 果 你 有 线程 对 应 
的 std: :thread 对 象 ， 你 就 可 以 等 竺 它 完 成 。 但 首先 你 得 局 动 它 ， 所 以 让 我 们 来 
看 一 看 局 动 线程 。 


2.1.1 ”启动 线程 


如 同 你 在 第 1 章 中 所 看 到 的 ， 线 程 是 通过 构造 std: :thread 对 象 来 开始 的 ， 

该 对 象 指定 了 线程 上 要 运行 的 任务 。 在 最 简单 的 情况 下 ， 该 任务 仅仅 是 一 个 普 普 
通通 的 返回 void 且 不 接受 参数 的 函数 。 这 个 函数 在 自己 的 线程 上 运行 ， 直 到 返 
回 ， 然 后 线程 停止 。 但 从 另 一 个 极端 看 ， 该 任务 可 能 是 一 个 接受 额外 参数 的 函数 
对 象 ， 当 它 运 行 时 ， 会 执行 一 系列 由 某 种 消息 机 制 所 指定 的 相互 独立 的 操作 ， 并 
且 只 有 当 线 程 再 次 通过 某 种 消息 机 制 接收 到 信和 号 时 才 会 停止 。 无 论 线程 将 要 做 什 
么 或 是 从 哪里 启动 ， 使 用 C++ 线程 库 来 开始 一 个 线程 总 归 是 要 构造 一 

个 std: :thread 对 象 。 


void do some workí); 
std::thread my threadí(do some work); 


就 是 这 么 简单 。 当 然 ， 你 必须 确保 引入 了 <thread> 头 文件 ， 从 而 编译 器 可 以 
找到 std: :thread 类 的 定义 。 与 许多 C++ 标准 库 相 似 ，std: :thread 可 以 与 任何 
可 调用 (callable〉 类 型 一 同 工 作 ， 所 以 你 可 以 将 一 个 带 有 函数 调用 操作 符 的 类 的 
实例 传递 给 std: :thread 的 构造 函数 来 进行 代替 。 


class background_task 


{ 
public: 
void operator()() const 
{ 
do something (); 
do something else ()j; 
} 
e 


background task f; 
std::thread my thread(f); 


在 这 种 情况 下 ， 所 提供 的 函数 对 象 被 复制 (copied〉 到 属于 新 创建 的 执行 线 
程 的 存储 器 中 ， 并 从 那里 调用 。 因 此 重要 的 是 ， 副 本 与 原版 有 着 等 效 的 行为 ， 人 否 
则 结果 可 能 会 与 预期 不 符 。 


当 给 线程 构 千 函数 传递 一 个 函数 对 象 时 要 考虑 的 一 件 事 是 避免 所 谓 的 “C++ 的 
最 环 手 的 解析 ”。 如 果 你 传递 一 个 临时 的 且 未 命名 的 变量 ， 那 么 其 语法 可 能 与 函数 
Fee eee ac T E UP EM ee 
H, 


std::thread my thread(background taskí)); 


PARR f rZimy thread, "C BRSEHRRAR A (SWARM IAA ZE A RINT 
返回 background_ task 对 象 的 函数 的 指针 ) ， 并 返回 std: :thread 对象， 而 不 是 
启动 一 个 新 线程 。 你 可 以 像 前 面 说 的 那样 通过 命名 函数 对 象 来 避免 这 种 情况 ， 通 
过 使 用 一 组 额外 的 括号 ， 或 使 用 新 的 统一 初始 化 语法 ， 例 如 ， 


std::thread my thread((background taskí))); 0 
std::thread my thread(background task ()}; -+ 人 © 


在 第 一 个 例子 @ 中 ， 额 外 的 括号 避免 其 解释 为 函数 声明 ， 从 而 让 my_thread 
被 声明 为 std: :thread 类 型 的 变量 。 第 二 个 例子 @ 使 用 新 的 统一 初始 化 语法 ， 用 
大 括号 而 不 是 括号 ， 同 样 也 是 声明 一 个 变量 。 


有 一 种 避免 了 此 问题 的 可 调用 对 象 类 型 ， 就 是 lambda 表 达 式 
(lambdaexpression) 。 这 是 C++11 中 的 一 项 新 功能 ， 其 基本 功能 是 允许 你 编写 
一 个 局 部 函数 ， 并 可 能 捕捉 一 些 局 部 变量 ， 同 时 避免 传递 额外 参数 的 需求 (参见 
2.2 节 ) 。 有 关 lambda 表 达 式 的 详情 ， 请 参阅 附录 A 中 A.5 节 。 前 面 的 例子 可 以 用 
lambda 表 达 式 编写 如 下 。 


std::thread my thread([]( 
do something(); 
do something else(); 


): 


一 且 开 始 了 线程 ， 你 需要 显 式 地 决定 是 要 等 待 它 完成 〈 通 过 结合 它 一 一 参见 
2.1.2 节 ) ， 还 是 让 它 自行 运行 〈 通 过 分 离 它 一 参见 2.1.3 节 ) 。 如 果 你 
在 std: :thread 对 象 被 销毁 前 未 作 诀 定 ， 那 么 你 的 程序 会 被 终止 Cstd::thread 
的 析 构 函数 调用 std: :terminate()) 。 因 此 ， 即 便 在 异常 存在 的 情况 下 ， 确 保 
线程 正确 地 结合 或 是 分 离 都 是 你 的 当务之急 。 请 参见 2.1.3 节 中 处 理 这 一 场景 的 技 
巧 。 需 要 注意 的 是 ， 你 只 需要 在 std: :thread 对 象 被 销毁 之 前 做 出 这 个 决定 即 可 
一 一 线程 本 身 可 能 在 你 结合 或 分 离 它 之 前 早 就 已 经 结束 了 ， 而 且 如 果 你 分 离 它 ， 
那么 该 线程 可 能 在 std: :thread 对 象 被 销毁 后 很 久 都 还 在 运行 。 


如 果 你 不 等 待 线程 完成 ， 那 么 你 需要 确保 通过 该 线程 访问 的 数据 是 有 效 的 ， 
直到 该 线程 完成 为 止 。 这 并 不 是 新 问题 一 一 即使 是 在 单线 程 代码 中 ， 在 对 象 被 销 
ur ala 但 线程 的 使 用 提供 了 过 到 这 种 生命 周期 问题 
JAN La. 


你 可 能 遇 到 这 样 问 题 的 一 种 情况 是 ， 当 线程 函数 持 有 局 部 变量 的 指针 或 引 
且 当 函数 退出 的 时 候 线程 尚未 完成 时 ， 清 单 2.1 展 示 的 就 是 这 样 一 个 场景 的 例 


清单 2.1 当 线 程 仍然 访问 局 部 变量 时 返回 的 函数 


struct func 
{ 


int& i; 


func(int& i ):i(i ){} 


void operator () () 

{ 
for {unsigned j=0;j<1000000;++j) ; 

9 对 悬空 引用 可 能 的 
do something(i); a 访问 

) 

) 

y; 


void oops() 
{ 


int some_local_state=0; 


func my func(some local state); 075558 
std::thread my thread(my func); 完成 O 新 的 线程 可 能 仍 在 
my thread.detach(); 4 运行 


) aal 


在 这 种 情况 下 ， 当 oops 退 出 @ 时 与 my_thread 相 关联 的 新 线程 可 能 仍然 在 运 


行 ， 因 为 通过 调用 detach() 全 你 已 经 显 式 地 决定 不 等 待 它 。 如 果 线 程 仍 在 运行 ， 
则 在 下 次 调用 do_something(i)@ 时 就 会 访问 一 个 已 被 销毁 的 变量 。 这 就 像 普通 
的 单线 程 代码 那样 一 一 允许 对 局 部 变量 的 指针 或 引用 持续 到 函数 退出 之 后 绝 不 是 
一 个 好 主意 一 一 但 对 于 多 线程 代码 更 容易 犯 这 样 的 错误 ， 因 为 当 它 发 生 的 时 候 ， 
并 不 一 定 是 显而易见 的 。 


一 个 常见 的 处 理 这 种 情况 的 方式 是 使 线程 函数 自 包 含 ， 并 且 把 数据 复制 
(copy〉 到 该 线程 中 而 不 是 共享 数据 。 如 果 你 为 线程 函数 使 用 了 一 个 可 调用 对 
象 ， 该 对 象 本 身 被 复制 到 该 线程 中 ， 那 么 原始 对 象 就 可 以 立即 被 销毁 。 但 是 你 仍 
然 需要 警惕 包含 有 指针 或 引用 的 对 象 ， 就 像 上 面 的 清单 2.1 那 样 。 特 别 地 ， 在 一 个 
人 
元 网 。 


另外 ， 通 过 结合 〈joining) 线程 ， 你 可 以 确保 在 函数 退出 前 ， 该 线程 执行 完 


毕 


2.1.2 ”等 待 线程 完成 


如 果 你 需要 等 待 线程 完成 ， 你 可 以 通过 在 相关 联 的 std: :thread 实 例 上 调 
用 join() 来 实现 。 在 清单 2.1 的 情况 下 ， 把 函数 体 右 括号 前 对 
my_thread.detach() 的 调用 蔡 换 为 调用 my_thread. join()， 就 将 足以 确保 在 
函数 退出 之 前 ， 即 局 部 变量 被 销毁 之 前 ， 该 线程 就 已 结束 。 在 这 种 情况 下 ， 就 意 
味 着 在 独立 的 线程 上 运行 函数 是 没什么 意义 的 ， 因 为 第 一 个 线程 在 此 期 间 将 做 不 
了 任何 有 用 的 事情 ， 但 在 实际 的 代码 当中 ， 初 始 线程 可 能 要 么 有 自己 的 工作 去 
做 ， 要 么 是 在 等 待 所 有 线程 完成 之 前 就 要 局 动 多 个 线程 来 做 有 用 的 工作 。 


join() 很 简单 也 很 暴力 一 一 你 要 么 等 待 一 个 线程 完成 要 么 就 不 等 。 如 果 你 需 
要 对 等 待 线程 进行 更 细 粒 度 的 控制 ， 比 如 检查 线程 是 否 完成 ， 或 只 是 在 一 段 特定 
的 时 间 内 进行 等 待 ， 那 么 就 必须 使 用 蔡 代 机 制 ， 例 如 条 件 变 量 和 future， 我 们 将 在 
第 4 章 中 提 到 。 调 用 join() 的 行为 也 会 清理 所 有 与 该 线程 相关 联 的 存储 器 ， 这 
样 std: :thread 对 象 不 再 与 现 已 完成 的 线程 相关 联 ， 它 也 不 与 任何 线程 相关 联 。 
这 就 意味 着 ， 你 只 能 对 一 个 给 定 的 线程 调用 一 次 join()， 一 旦 你 调用 了 
join()， 此 std: :thread 对象 不 再 是 可 连接 的 ， 并 且 joinable() 将 返回 
false. 


24.3. (ETE EHE RAS 


如 前 所 述 ， 你 要 确保 在 std: :thread 对 象 被 销毁 前 已 调用 join() 
或 detach() 函 数 。 如 果 要 分 离线 程 ， 通 常 在 线程 启动 后 就 可 以 立即 调 
用 detach()， 所 以 这 不 是 个 问题 。 但 是 如 果 打 算 等 待 该 线程 ， 就 需要 仔细 地 选择 
在 代码 的 哪个 位 置 调 用 join()。 这 意味 着 ， 如 果 在 线程 开始 之 后 但 又 是 在 调 
用 join() 之 前 引发 了 异常 ， 对 join() 的 调用 就 容易 被 跳 过 。 


为 了 避免 应 用 程序 在 引发 异常 的 时 候 被 终止 ， 你 需要 在 这 种 情况 决定 要 做 什 
么 。 一 般 来 说 ， 如 果 你 打算 在 非 异 常 的 情况 下 调用 join()， 你 还 需要 在 存在 弄 各 
时 调用 join()， 以 避免 意外 的 生命 周期 问题 。 清 单 2.2 展 示 了 这 样 的 简单 代码 。 


清单 2.2 ”等待 线程 结束 


struct func; 


4 | 参见 清单 2.1 中 的 
定义 


void £() 
{ 
int some local state-0; 
func my func(some local state) i 
std: :上 thread t (my_func) ; 
try 
{ 
do something in current thread(); 


) 


eaten (3) 

{ 
t.join(); +0 
throw; 

} 

t.join(); 十 和 


} 


清单 2.2 中 的 代码 使 用 了 try/catch 块 ， 以 确保 访问 局 部 状态 的 线程 在 函数 退 
出 前 结束 ， 无 论 函数 是 正常 退出 还 是 异常 @ 中 断 。 使 用 try/catch 块 很 吕 嗪 ， 
而 且 容易 将 作用 域 弄 乱 ， 所 以 并 不 是 一 个 理想 的 方案 。 如 果 确 保 线 程 必须 在 函数 
退出 前 完成 是 很 重要 的 一 一 无 论 是 因为 它 具 有 对 其 他 局 部 变量 的 引用 还 是 任何 其 
他 原因 一 一 那么 确保 这 是 所 有 可 能 的 退出 路 径 的 情况 是 很 重要 的 ， 无 论 正常 还 是 
异常 ， 并 且 和 希望 提供 一 个 这 样 做 的 简单 明了 的 机 制 。 


这 样 做 的 方法 之 一 是 使 用 标准 的 资源 获取 即 初 始 化 〈RAII) 惯用 语法 ， 并 提 
供 一 个 类 ， 在 它 的 析 构 函数 中 进行 join()， 正 如 清单 2.3 的 代码 。 看 看 它 是 如 何 
简化 函数 f() 的 。 


清单 2.3 ”使 用 RAII 等 待 线程 完成 


class thread_guard 
{ 
std: :thread& t; 
public: 
explicit thread guard(std::thread& t ): 
Ete) 
{} 


t 
~thread_guard () 


if (t.joinable()) -© 
{ 
t.join(); -© 
} 
} 
thread guardithread guard const&)-delete; « 


thread guard& operator-(thread guard const&)-delete; 
Y: 
struct func; 4 参见 清单 21 中 的 
void £() 定义 
{ 

int some local statez0; 

func my func(some local state); 

std::thread t(my func); 

thread guard g(t); 


do something in current thread(); 


) «o 
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便 是 当 函 数 因 do_something_in_current_thread 引 发 异常 而 退出 的 情况 下 也 会 
发 生 。 


在 清单 2.3 中 的 析 构 函数 在 调用 join() 仿 前 首先 测试 thread_guard 的 析 构 函 
数 是 不 是 joinable( )@ 的 。 这 很 重要 ， 因 为 对 于 一 个 给 定 的 执行 线程 join() 只 
能 被 调用 一 次 ， 所 以 如 果 线 程 已 经 被 结合 ， 这 样 做 就 是 错误 的 。 


拷 见 构造 函数 和 拷贝 赋值 运算 符 被 标记 =delete 人 @， 以 确保 他 们 不 会 由 编译 
器 自动 提供 。 复 制 或 赋值 这 样 一 个 对 象 可 能 是 危险 的 ， 因 为 它 可 能 比 它 要 结合 的 
线程 的 作用 域 存在 得 更 久 。 通 过 将 它们 声明 为 已 删除 的 ， 任 何 复 
制 thread_guard 对 象 的 企图 都 将 产生 编译 错误 。 参 见 附录 A 中 A.2 节 ， 了 解 更 多 
关于 已 删除 的 函数 。 

如 果 无 需 等 待 线程 完成 ， 可 以 通过 分 离 〈detaching) 它 来 避免 这 种 异常 安全 
问题 。 这 打破 了 线程 与 std: :thread 对 象 的 联系 并 确保 当 std: :thread 对 象 被 销 
BIN std: :terminate() 不 会 被 调用 ， 即 使 线程 仍 在 后 台 运 行 。 


2.1.4 在 后 台 运 行 线程 
在 std: :thread 对 象 上 调用 detach() 会 把 线程 丢 在 后 台 运 行 ， 也 没有 直接 的 


方法 与 之 通信 。 也 不 再 可 能 等 待 该 线程 完成 ， 如 果 一 个 线程 成 为 分 离 的 ， 获 取 一 
个 引用 它 的 std: :thread 对 象 也 是 不 可 能 的 ， 所 以 它 也 不 再 能 够 被 结合 。 分 离 的 
线程 确实 是 在 后 台 运 行 ， 所 有 权 和 控制 权 被 转交 给 C++ 运行 时 库 ， 以 确保 与 线程 
相关 联 的 资源 在 线程 退出 后 能 够 被 正确 地 回收 。 


参照 UNIX 的 守护 进程 (daemon process) 概念 ， 被 分 离 的 线程 通常 被 称 为 守 
护 线程 〈daemon threads) ， 它 们 无 需 任 何 显 式 的 用 户 界 面 ， 而 运行 在 后 台 。 这 
样 的 线程 通常 是 长 时 间 运 行 的 ， 它 们 可 能 在 应 用 程序 的 几乎 整个 生命 周期 中 都 在 
运行 ， 执 行 后 台 任 务 ， 例 如 监控 文件 系统 、 清 除 对 象 缓存 中 的 未 使 用 项 或 是 优化 
数据 结构 。 在 另 一 个 极端 ， 有 另 一 种 鉴别 线程 何 时 完成 的 机 制 ， 或 者 线程 被 用 
作 * 即 用 即 筷 ”任务 ， 在 这 里 使 用 分 离线 程 也 是 有 意义 的 。 


如 你 在 2.1.2 节 中 已 经 看 到 的 ， 你 通过 调用 std: :thread 对 象 的 detach( ) 的 成 
员 函 数 来 分 离线 程 。 在 调用 完成 后 ，std: :thread 对 象 不 再 与 执行 的 实际 线程 相 
关联 ， 同 时 也 不 能 够 被 加 入 。 


std::thread t (do_background_work) ; 
t.detach() ; 
assert (!t.joinable()}; 


为 了 从 一 个 std: :thread 对 象 中 分 离线 程 ， 必 须 有 一 个 线程 供 分 离 。 你 不 能 
在 一 个 没有 与 执行 线程 相关 联 的 std: :thread 对 象 上 调用 detach()。 这 对 于 
join() 也 是 同样 的 要 求 ， 你 可 以 用 完全 相同 的 方法 进行 检查 一 一 你 只 能 
在 t.joinable() 返 回 true 的 时 候 ， 为 一 个 std: :thread 对 象 t 调 
Hjt.detach(). 


考虑 一 个 类 似 于 字 处 理 器 的 应 用 程序 ， 它 可 以 一 次 编辑 多 个 文档 。 有 许多 种 
方法 在 UI 级 别 和 内 部 来 处 理 这 个 问题 。 有 一 种 现在 看 起 来 越 来 越 普 裔 的 方式 ， 是 
具有 多 个 相互 独立 的 顶层 窗口 ， 与 正在 编辑 的 文档 一 一 对 应 。 尽 管 这 些 窗口 看 起 
来 完全 独立 ， 各 上 自 拥有 上 自己 的 沫 单 等， 但 它们 是 在 同一 个 应 用 程序 的 实例 上 运行 
的 。 一 种 在 内 部 处 理 这 个 问题 的 方式 是 在 其 自己 的 线程 中 运行 各 自 的 文档 编辑 窗 
O; 每 个 线程 都 运行 相同 的 代码 ， 但 拥有 与 被 编辑 文档 相关 的 不 同 的 数据 以 及 相 
应 的 窗口 属性 。 打 开 一 个 新 的 文档 就 需要 启动 一 个 新 的 线程 。 处 理 请 求 的 线程 并 
不 在 乎 等 待 其 他 的 线程 完成 ， 因 为 它 在 一 个 不 相关 的 文件 上 工作 ， 所 以 运行 分 离 
的 线程 就 成 为 了 首选 。 


清单 2.4 展 示 了 这 种 方法 的 简单 的 代码 大 纲 。 
清单 2.4 分 离线 程 以 处 理 其 他 文档 


mi 


void edit document (std::string const& filename) 


{ 


open document and display gui (filename); 
while(!done editing()) 
{ 
user command cmd=get_user_input (); 
if (cmd.type==open_new document) 


{ 


std::string const new_name=get_filename_from_user () ; 
std::thread t (edit document,new name); <0 


t.detach(); <Q 
} 


else 


{ 
} 


process user input (cmd); 


如 果 用 户 选择 打开 一 个 新 的 文档 ， 它 会 提示 其 有 文档 要 打开 ， 启 动 新 线程 来 
打开 该 文档 @， 人 然后 分 离 它 全 。 因 为 新 的 线程 与 当前 线程 做 着 同样 的 操作 ， 只 是 
文件 不 同 ， 你 可 以 用 新 选 定 的 文件 名 作为 参数 ， 重 用 同一 个 函数 


(edit document) 。 


这 个 例子 还 展示 了 一 个 案例 ， 它 有 助 于 传递 参数 给 用 来 启动 线程 的 函数 : 并 
非 仅 仅 将 函数 名 传递 给 std: :thread 构 造 函 数 @， 你 还 可 以 传递 文件 名 参数 。 虽 
然 也 有 其 他 机 制 能 够 做 到 这 一 点 ， 例 如 使 用 有 具有 成 员 数 据 的 函数 对 象 取代 普通 的 
带 有 参数 的 函数 ， 但 线程 库 提供 了 一 个 简单 方法 来 实现 之 。 


2.2 ”传递 参数 给 线程 函数 


如 清单 2.4 中 所 示 ， 传 递 参数 给 可 调用 对 象 或 函数 ， 基 本 上 就 是 简单 地 将 额外 
的 参数 传递 给 std: :thread 构 造 函 数 。 但 重要 的 是 ， 参 数 会 以 默认 的 方式 被 复制 
(copied). 到 内 部 存储 空间 ， 在 那里 新 创建 的 执行 线程 可 以 访问 它们 ， 即 便 函 数 
中 的 相应 参数 期 待 着 引用 。 这 里 有 一 个 简单 的 例子 。 


void f{int i,std::string const& s}; 
std: :thread t(f,3,”hello”}; 

这 里 创建 一 个 新 的 与 t 相 关联 的 执行 线程 ， 称 为 f(3，"hello" )。 注 意 即 使 f 
接受 std: :string 作 为 第 二 个 参数 ， 字 符 串 字面 值 仅 在 新 线程 的 上 下 文中 才 会 作 
Achar const* 传 送 ， 并 转换 为 std: :string。 尤 其 重要 的 是 当 提 供 的 参数 是 一 
个 自动 变量 的 指针 时 ， 如 下 所 示 。 


void f(int i,std::string const& sS); 


void oops{int some param) 


{ 
char buffer[1024] ; 0 
sprintf (buffer, "%i",some_param} ; 
std::thread t(f,3,buffer); -© 
t.detach(); 

} 


FEI F, Ese eu EbuffereM RE aia AO, XT 
重要 的 时 机 ， 即 函数 oops 会 在 缓冲 在 新 线程 上 被 转换 为 std: :string 之 前 退出 ， 
从 而 导致 未 定义 的 行为 。 解 决 之 道 是 在 将 缓冲 传递 给 std: :thread 的 构造 函数 之 
前 转换 为 std: :string。 


std::string, 
void f(int i,std::string const& s); 


void not oops(int some param) 
{ 
char buffer[1024]; . , 
sprintf(buffer,"$i",some param); 使 用 std::string 避免 悬浮 
指针 


std::thread t(f,3,std::string(buffer)); E 
t.detach(); 


) 


在 这 种 情况 下 ， 问 题 就 出 在 你 依赖 从 缓冲 的 指针 到 函数 所 期 望 的 


std: :string 对 象 的 隐 式 转换 ， 因 为 std: :thread 构 造 函 数 原 样 复制 了 所 提供 的 
值 ， 并 未 转换 为 期 望 的 参数 类 型 。 


也 有 可 能 得 到 相反 的 情况 ， 对 象 被 复制 ， 而 你 想 要 的 是 引用 。 这 可 能 发 生 在 
当 线程 正在 更 新 一 个 通过 引用 传递 来 的 数据 结构 时 ， 例 如 ， 


void update_data_for_widget (widget_id w,widget_data& data) ; +@ 


void oops again(widget id w) 


{ 


widget data data; 


std::thread t(update data for widget,w,data); m 
display status(); 

ESTON 

process widget _ data (data); + 人 © 


尽管 update_data_for_widget@ 希 望 通过 引用 传递 第 二 个 参 

数 ，std: :thread 的 构造 函数 @ 却 并 不 知道 ， 它 无 视 函 数 所 期 望 的 类 型 ， 并 且 盲 
目地 复制 了 所 提供 的 值 。 当 它 调用 update_data_for_widget 时 ， 它 最 后 将 传 
递 data 在 内 部 的 副本 的 引用 而 非 对 data 自 身 的 引用 。 于 是 ， 当 线程 完成 时 ， 随 着 
所 提供 参数 的 内 部 副本 的 销毁 ， 这 些 改动 都 将 被 舍弃 ， 将 会 传递 一 个 未 改变 的 
data 合 ， 而 非 正确 更 新 的 版 本 给 process_widget_data。 对 于 熟悉 std: :bind 
的 人 来 说 ， 解 决 方案 也 是 显而易见 的 ， 你 需要 用 std: :ref 来 包装 确实 需要 被 引用 
的 参数 。 在 这 种 情况 下 ， 如 果 你 将 对 线程 的 调用 改 为 


std::thread t (update data for widget,w,std::refí(data)); 


Ji update data for widget 将 被 正确 地 传 入 data 的 引用 ， 而 非 data 副 本 
Ccopy) 的 引用 。 


如 果 你 熟悉 std: :bind， 那 么 参数 传递 语义 就 不 足 为 奇 ， 因 为 std: :thread 
构造 函数 和 std: :bind 的 操作 都 是 依据 相同 的 机 制定 义 的 。 这 意味 着 ， 例 如 ， 你 
可 以 传递 一 个 成 员 函 数 的 指针 作为 函数 ， 前 提 是 提供 一 个 合适 的 对 象 指 针 作 为 第 


一 个 参数 。 


class X 
{ 
public: 
void do lengthy work(); 
}; 


X my x; 
std::thread t(&X::do lengthy work,&my x); +@ 


这 段 代 码 将 在 新 线程 上 调用 my_x.do_lengthy_work()， 因 为 my_x 的 地 址 是 
作为 对 象 指针 @ 提 供 的 。 你 也 可 以 提供 参数 给 这 样 的 成 员 函 数 调 
FA: std: :thread 构 造 函 数 的 第 三 个 参数 将 作为 成 员 函 数 的 第 一 个 参数 等 等 。 


提供 参数 的 另 一 个 有 趣 的 场景 是 ， 这 里 的 参数 不 能 被 复制 但 只 能 被 移动 

(moved) : 一 个 对 象 内 保存 的 数据 被 转移 到 另 一 个 对 象 ， 使 原来 的 对 象 变 成 * 空 
壳 ”。 这 种 类 型 的 一 个 例子 是 std: :unique_ptr， 它 提供 了 动态 分 配对 象 的 自动 
内 存 管理 。 只 有 一 个 std: :unique_ptr 实 例 可 以 在 某 一 时 刻 指向 一 个 给 定 的 对 
象 ， 当 该 实例 被 销毁 时 ， 其 指向 的 对 象 将 被 删除 。 移 动 构造 冰 数 (move 
constructor) 和 移动 赋值 运算 符 (move assignment operator) 允许 一 个 对 象 的 所 
有 权 在 std: :unique_ptr 实 例 之 间 进 行 转移 (参见 附录 A 中 A.1.1 节 ， 关 于 移动 语 
义 的 详情 ) 。 这 种 转移 给 源 对 象 留 下 一 个 NULL 指 针 。 这 种 值 的 移动 使 得 该 类 型 的 
对 象 作为 函数 的 参数 被 接受 或 从 函数 返回 值 。 在 源 对 象 是 临时 的 场合 ， 这 种 移动 
是 自动 的 ， 但 在 源 是 一 个 命名 值 的 地 方 ， 此 转移 必须 直接 通过 调用 std: :move() 
人 下 面 的 示例 展示 了 运用 std: :move 将 动态 对 象 的 所 有 权 转 移 到 一 个 线程 


void process big object (std:;:unique ptr<big object»); 


std: : unique ptr«big object» p{new big object); 
p-»prepare data(42}; 
std::thread t (process big object,std::move(p) }; 


通过 在 std: :thread 构 造 函 数 中 指定 std: :move(p)，big_object 的 所 有 权 
先 被 转移 进 新 创建 的 线程 的 内 部 存储 中 ， 然 后 进入 process_big_obJject。 


标准 线程 库 中 的 一 些 类 表现 出 与 std: :unique_ptr 相 同 的 所 有 权 语 
义 ，std: :thread 就 是 其 中 之 一 。 虽 然 std: :thread 实 例 并 不 拥有 
与 std: :unique_ptr 同 样 方式 的 动态 对 象 ， 但 他 们 却 拥有 资源 ， 每 一 个 实例 负责 
管理 一 个 执行 线程 。 这 种 所 有 权 可 以 在 实例 之 间 进 行 转 移 ， 因 为 std: :thread 的 
实例 是 可 移动 的 (movable) ， 即 使 他 们 不 是 可 复制 的 《copyable) 。 这 确保 了 
在 允许 程序 员 选 择 在 对 象 之 间 转 换 所 有 权 的 时 候 ， 在 任意 时 刻 只 有 一 个 对 象 与 某 
个 特定 的 执行 线程 相 “关联 。 


2.3 ”转移 线程 的 所 有 权 


假设 你 想 要 编写 一 个 函数 ， 它 创建 一 个 在 后 台 运 行 的 线程 ， 但 是 疝 调用 函数 
回 传 新 线程 的 所 有 权 ， 而 非 等 待 其 完成 ， 又 或 者 你 想 要 反 过 来 做 ， 创 建 一 个 线 
程 ， 并 将 所 有 权 传 递 给 要 等 竺 它 完 成 的 函数 。 在 任意 一 种 情况 下 ， 你 都 需要 将 所 
有 权 从 一 个 地 方 转移 到 另 一 个 地 方 。 


这 里 就 是 std: :thread 支 持 移动 的 由 来 。 正 如 在 上 一 节 所 描述 的 ， 在 C++ 标 
准 库 里 许多 拥有 资源 的 类 型 ， 如 std: :ifstream 和 std : :unique_ptr 是 可 移动 
HJ (movable) ， 而 非 可 复制 的 〈copyable) ， 并 且 std: :thread 就 是 其 中 之 
。 这 意味 着 一 个 特定 执行 线程 的 所 有 权 可 以 在 std: :thread 实 例 之 间 移 动 ， 如 
同 接 下 来 的 例子 。 该 示例 展示 了 创建 两 个 执行 线程 ， 以 及 在 三 个 std: :thread 实 
例 t1、t2 和 t3 之 间 对 那些 线程 的 所 有 权 进 行 转移 。 


void some function(); 
void some other function(); 


std::thread tl1í(some function); 4 (1) 

std: :thread t2-std::move (t1); -© 
tl=std::thread(some_other_ function); -© 

std: :thread t3; E Oo 

t3-std::move (t2); -© Q 此 赋值 将 终结 程序 ! 
tl=std: :move (t3) ; 4 | 


首先 ， 启 动 一 个 新 线程 @ 并 与 t1 相 关联。 然后 当 t2 构 建 完成 时 所 有 权 被 转移 
给 t2， 通 过 调用 std: :move() 来 显 式 地 转移 所 有 权 仿 。 此 刻 ，t1 不 再 拥有 相关 联 
的 执行 线程 ， 运 行 some_function 的 线程 现在 与 t2 相 关联 。 


然后 ， 启 动 一 个 新 的 线程 并 与 一 个 临时 的 std: :thread 对 象 相关 联 食 。 接 下 
来 将 所 有 权 转 移 到 t1 中 ， 是 不 需要 调用 std: :move() 来 显 式 移动 所 有 权 的 ， 因 为 
此 处 所 有 者 是 一 个 临时 对 象 一 一 从 临时 对 象 中 进行 移动 是 自动 和 隐 式 的 。 


t3 是 默认 构造 的 人 @， 这 意味 着 它 的 创建 没有 任何 相关 联 的 执行 线程 。 当 前 
与 t2 相 关联 的 线程 的 所 有 权 转 移 到 t3@， 再 次 通过 显 式 调用 std: :move()， 
为 t2 是 一 个 命名 对 象 。 在 所 有 这 些 移动 之 后 ，t1 与 运行 some_other_function 
的 线程 相关 联 ，t2 没 有 相关 联 的 线程 ，t3 与 运行 some_function 的 线程 相关 联 。 


最 后 一 次 移动 @ 将 运行 some_function 的 线程 的 所 有 权 转 回 给 t1。 但 是 在 这 
种 情况 下 til 已 经 有 了 一 个 相关 联 的 线程 (运行 着 some_other_function) ， 所 以 
会 调用 std: :terminate() 来 终止 程序 。 这 样 做 是 为 了 与 std: :thread 的 析 构 函 
数 保 持 一 致 。 你 在 第 2.1.1 节 曾 看 到 ， 你 必须 在 析 构 前 显 式 地 等 待 线程 完成 或 是 分 
离 ， 这 同样 适用 于 赋值 : 你 不 能 仅仅 通过 向 管理 一 个 线程 的 std: :thread 对 象 赋 
值 一 个 新 的 值 来 “舍弃 ”一 个 线程 。 


std: :thread 支持 移动 意味 着 所 有 权 可 以 很 容易 地 从 一 个 函数 中 被 转移 出 ， 
如 清单 2.5 所 示 。 


清单 2.5 从 函数 中 返回 std::thread 
std: :thread f() 


void some function(); 
return std::thread(some function); 

j 

std::thread g() 

{ 
void some other function (int); 
std::thread t(some other function,42); 
return t; 

j 


同样 地 ， 如 果 要 把 所 有 权 转 移 到 函数 中 ， 它 只 能 以 值 的 形式 接受 
std: :thread 的 实例 作为 其 中 一 个 参数 ， 如 下 所 示 。 
void f(std::thread t); 
void g() 


void some function(); 

f (std: : thread (some_function)) ; 
std: :thréad t (some. function); 
f (std: :move (七 ) ) ; 


std: :thread 文 持 移动 的 好 处 之 一 ， 就 是 你 可 以 建立 在 清单 2.3 中 
thread_guard 类 的 基础 上 ， 同 时 使 它 实 际 上 获得 线程 的 所 有 权 。 这 可 以 避 
免 thread_guard 对 象 在 引用 它 的 线程 结束 后 继续 存在 所 造成 的 不 良 影响 ， 同 时 
意味 着 一 旦 所 有 权 转 移 到 了 该 对 象 ， 那 么 其 他 对 象 都 不 可 以 结合 或 分 离 该 线 
程 。 因 为 这 主要 是 为 了 确保 在 退出 一 个 作用 域 之 前 线程 都 已 完成 ， 我 把 这 个 类 称 
为 scoped_thread。 其 实现 如 清单 2.6 所 示 ， 同 时 附带 一 个 简单 的 示例 。 


清单 2.6 ”scoped_thread 和 示例 用 法 


class scoped_thread 


{ 
std::thread t; 
public: 


explicit scoped thread(std::thread t ): 4 (1) 
t (std: :move(t_)) 


{ 
if (!t.joinable()) -© 
throw std::logic error("No thread"); 


) 


~scoped thread() 


( 
t.joinO0:; 29 
} 
scoped thread(scoped thread const&)=delete; 
scoped thread& operator= (scoped thread consté&) =delete; 


)1 
struct func; t+ ens 
2 Wi 
? 


void £() 单 2. 
{ 


int some_local_state; 
scoped thread tí(std::thread(func(some local state))); 0 


do something in current thread(); 


) -© 


这 个 例子 与 清单 2.3 类 似 ， 但 是 新 线程 被 直接 传递 到 scoped_thread@@， 而 不 
是 为 它 创建 一 个 单独 的 命名 变量 。 当 初始 线程 到 达 f@ 的 结 尼 
时 ，scoped_thread 对 象 被 销 贷 ， 然 后 结合 全 提供 给 构造 函数 @ 的 线程 。 使 用 清 
单 2.3 中 的 thread_guard 类 ， 析 构 函 数 必须 检查 线程 是 不 是 仍然 可 结合 ， 你 可 以 
在 构造 函数 中 全 来 做 ， 如 果 不 是 则 引发 异常 。 


std: :thread 对 移动 的 支持 同样 考虑 了 std: :thread 对 象 的 容器 ， 如 果 那 些 
容器 是 移动 感知 的 (如 更 新 后 的 std: :vector<>) 。 这 意味 着 你 可 以 编写 像 清单 
2.7 中 的 代码 ， 生 成 一 批 线 程 ， 然 后 等 待 它 们 完成 。 


清单 2.7 生成 一 批 线程 并 等 待 它们 完成 


void do work(unsigned id); 


void £() 
( 
std: :vector<std::thread> threads; 
for (unsigned i=0;i<20;++i) 
{ | 
threads.push_back(std::thread(do_work,i)); < 
} 
std::for each(threads.begin(),threads.end(), 轮流 在 每 个 线程 上 
std::mem fn(&std::thread::join)); 2 调用 join) 


如 果 线 程 是 被 用 来 细 分 某 种 算法 的 工作 ， 这 往往 正 是 所 需 的 。 在 返回 调用 者 


之 前 ， 所 有 线程 必须 全 都 完成 。 当 然 ， 清 单 2.7 的 简单 结构 意味 着 由 线程 所 做 的 工 
作 是 自 包含 的 ， 同 时 它们 操作 的 结果 纯粹 是 共享 数据 的 副作用 。 如 果 f() 向 调用 
者 返回 一 个 依赖 于 这 些 线程 的 操作 结果 的 值 ， 那 么 正如 所 写 的 这 样 ， 该 返回 值 就 
得 通过 检查 线程 终止 后 的 共享 数据 来 决定 。 在 线程 间 转 移 操 作 结 果 的 蔡 代 方案 将 
在 第 4 章 中 讨论 。 


将 std: :thread 对 象 放 到 std: :vector 中 是 线程 迈 向 自动 管理 的 一 步 。 与 其 
为 那些 线程 创建 独立 的 变量 并 直接 与 之 结合 ， 不 如 将 它们 视 为 群 组 。 你 可 以 进 一 
步 创 建 在 运行 时 确定 的 动态 数量 的 线程 ， 更 进一步 地 利用 这 一 步 ， 而 不 是 如 清单 
2.7 中 的 那样 创建 固定 的 数量 。 


2.4 在 运行 时 选择 线程 数量 


C++ 标准 库 中 对 此 有 所 帮助 的 特性 
是 std: :thread: :hardware_currency()。 这 个 函数 返回 一 个 对 于 给 定 程 序 执 
行 时 能 够 真正 并 发 运行 的 线程 数量 的 指示 。 例 如 ， 在 多 核 系统 上 它 可 能 是 CPU 核 
心 的 数量 。 它 仅仅 是 一 个 提示 ， 如 果 该 信息 不 可 用 则 函数 可 能 会 返回 0， 但 它 对 
于 在 线程 间 分 割 任务 是 一 个 有 用 的 指南 。 


清单 2.8 展 示 了 std: :accumulate 的 一 个 简单 的 并 行 版 本 实现 。 它 在 线程 之 
间 划 分 所 做 的 工作 ， 使 得 每 个 线程 具有 最 小 数 日 的 元 素 以 避免 过 多 线程 的 开销 。 
请 注意 ， 该 实现 假定 所 有 的 操作 都 不 引发 异常 ， 即 便 异常 可 能 会 发 生 。 例 
W, std: :thread 构 造 函 数 如 果 不 能 启动 一 个 新 的 执行 线程 那么 它 将 引发 异常 。 
在 这 样 的 算法 中 处 理 异常 超出 了 这 个 简单 示例 的 范围 ， 将 放 在 第 8 章 中 阐述 。 


清单 2.8 std::accumulate 的 简单 的 并 行 版 本 


template<typename Iterator,typename T> 
struct accumulate block 


{ 


void operator() (Iterator first,Iterator last,T& result) 


{ 
} 


result=std::accumulate(first,last,result) ; 


): 


template<typename Iterator,typename T» 
T parallel accumulate(Iterator first,Iterator last,T init) 


{ 


unsigned long const length-std::distance(first,last); 


if(!length) 0 


return init; 


unsigned long const min_per_thread=25; 
unsigned long const max threads= 
(length+min_per_thread-1)/min_per_thread; -+ 人 © 


unsigned long const hardware threads= 
std::thread: :hardware concurrency () ; 


unsigned long const num_threads= em 
std::min(hardware threads!-0?hardware threads:2,max threads); 


std::vector<T> results (num_threads) ; 


unsigned long const block size-length/num threads; 0O 
std::vector<std::thread> threads (num threads-1); + 人 © 


Iterator block start-first; 
for (unsigned long i=0;i< (num _threads-1) ;++1) 
{ 
Iterator block_end=block_start; 
std: :advance (block end,block size); +@ 
threads [i] =std: : thread ( —9 
accumulate block«Iterator,T»(), 
block start,block end,std::refí(results[i])):; 
block start-block end; +@ 
} 
accumulate block«Iterator,T»()( 
block start,last,results[num threads-1]); -© 


std::for each(threads.begin(),threads.end(), 
Std::mem fn(&std::thread::join)); «D 


return std::accumulate(results.begin(),results.end(),init); «p 
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@@， 只 返回 初始 值 init。 否 则 ， 此 范围 内 至 少 有 一 个 元 素 ， 于 是 你 将 要 人 处理 的 元 
素数 量 除 以 最 小 的 块 大 小 ， 以 获取 线程 的 最 大 数量 介 。 这 是 为 了 避免 当 范 围 中 内 
有 五 个 值 时 ， 在 一 个 32 核 的 机 器 上 创建 32 个 线程 。 


要 运行 的 线程 数 是 你 计算 出 的 最 大 值 和 硬件 线程 数量 全 的 较 小 值 。 你 不 会 想 
要 运行 比 硬件 所 能 文 持 的 更 多 的 线程 〈 超 额 订阅 ，oversubscription ) ， 因 为 上 下 
文 切换 将 意味 着 更 多 的 线程 会 降低 性 能 。 如 果 对 
std: :thread: :hardware_concurrency() 的 调用 返回 0， 你 只 需 简单 地 替换 上 
你 所 选择 的 数量 ， 在 这 个 例子 中 我 选择 了 2。 你 不 会 想 要 运行 过 多 的 线程 ， 因 为 
在 单 核 的 机 器 上 这 会 使 事情 变 慢 ， 但 同样 地 你 也 不 希望 运行 的 过 少 ， 因 为 那样 的 
话 ， 你 就 会 错过 可 用 的 并 发 。 


每 个 待 处 理 的 线程 的 条 目 数 量 是 范围 的 长 度 除 以 线程 的 数量 @。 如 果 你 担心 
数量 不 能 整除 ， 没 必要 一 一 稍 后 再 来 处 理 。 


既然 你 知道 有 多 少 个 线程 ， 你 可 以 为 中 间 结 果 创 建 一 个 std: :vector<T>， 
同时 为 线程 创建 一 个 std: :vector<std: :thread>@@。 请 注意 ， 你 需要 启动 比 
num_threads 少 一 个 的 线程 ， 因 为 已 经 有 一 个 了 。 


启动 线程 是 个 简单 的 循环 : 递 进 block_end 连 代 器 到 当前 块 的 结尾 @， 并 启 
动 一 个 新 的 线程 来 累计 此 块 的 结果 @。 下 一 个 块 的 开始 是 这 一 个 的 结束 合 。 


当 你 启动 了 所 有 的 线程 后 ， 这 个 线程 就 可 以 处 理 最 后 的 块 @@。 这 就 是 你 处 理 
所 有 未 被 整除 的 地 方 。 你 知道 最 后 一 块 的 结尾 只 能 是 last， 无 论 在 那个 块 里 有 多 
少 元 素 。 一 旦 累计 出 最 后 一 个 块 的 结果 ， 你 可 以 等 待 所 有 使 用 std: :for_each 生 
成 的 线程 四 ， 如 清单 2.7 中 所 示 ， 接 着 通过 最 后 调用 std: :accumulate 将 结果 累 
加 起 来 @。 


在 你 离开 这 个 例子 前 ， 值 得 指出 的 是 在 类 型 T 的 加 法 运算 符 不 满足 结合 律 的 
地 方 〈 如 float 和 double) ， 这 个 parallel accumulate 的 结果 可 能 会 跟 
std: :accumulate 的 有 所 出 入 ， 这 是 将 范围 分 组 成 块 导 致 的 。 此 外 ， 对 迭代 器 的 
需求 要 更 严格 一 些 ， 它 们 必须 至 少 是 前 向 迭代 器 Cforward iterators) ， 然 
而 std: :accumulate 可 以 和 单 通 输入 迭代 器 (input iterators) 一 起 工作 ， 同 时 T 
必须 是 可 默认 构造 的 〈default constructible) 以 使 得 你 能 够 创建 results 疝 量 。 
这 些 需求 的 各 种 变化 是 并 行 算 法 很 常见 的 ， 就 其 本 质 而 言 ， 它 们 以 某 种 方式 的 不 
同 是 为 了 使 其 并 行 ， 并 且 在 结果 和 需求 上 产生 影响 。 并 行 算法 会 在 第 8 章 中 进行 
更 深入 的 阐述 。 另 外 值得 一 提 的 是 ， 因 为 你 不 能 直接 从 一 个 线程 中 返回 值 ， 所 以 


你 必须 将 相关 项 的 引用 传 入 results 问 量 中 。 从 线程 中 返回 结果 的 替代 方法 ， 会 
在 第 4 章 中 通过 使 用 future 来 实现 。 


在 这 种 情况 下 ， 每 个 线程 所 需 的 所 有 信息 在 线程 开始 时 传 入 ， 包 括 存 储 其 计 
算 结果 的 位 置 。 实 际 情况 并 非 总 是 如 此 。 有 时 ， 作 为 进程 的 一 部 分 有 必要 能 够 以 
某 种 方式 标识 线程 。 你 可 以 传 入 一 个 标识 数 ， 如 同 在 清单 2.7 中 i 的 值 ， 但 是 如 果 
需要 此 标识 符 的 函数 在 调用 栈 中 深 达 数 个 层次 ， 并 且 可 能 从 任意 线程 中 被 调用 ， 
那样 做 就 很 不 方便 。 当 我 们 设计 C++ 线程 库 时 就 预见 到 了 这 方面 的 需求 ， 所 以 每 
个 线程 都 有 一 个 唯一 的 标识 符 。 


2.5 ”标识 线程 


线程 标识 符 是 std: :thread: :id 类 型 的 ， 并 且 有 两 种 获取 方式 。 其 一 ， 线 程 
的 标识 符 可 以 通过 从 与 之 相关 联 的 std: :thread 对 象 中 通过 调用 get_id() 成 员 函 
数 来 获得 。 如 果 std: :thread 对 象 没有 相关 联 的 执行 线程 ， 对 get_id() 的 调用 返 
回 一 个 默认 构造 的 std: :thread: :id 对 象 ， 表 示 “ 没 有 线程 >。 另 外 ， 当 前 线程 的 
标识 符 ， 可 以 通过 调用 std: :this_thread: :get_id() 获 得 ， 这 也 是 定义 
在 <thread> 头 文件 中 的 。 


std: :thread: :id 类 型 的 对 象 可 以 自由 地 复制 和 比较 : 否则 ， 它 们 作为 标识 
符 就 没什么 大 用 处 。 如 果 两 个 std: :thread: :id 类 型 的 对 象 相 等 ， 则 它们 代表 着 
同一 个 线程 ， 或 两 者 都 具有 “没有 线程 > 的 值 。 如 果 两 个 对 象 不 相等 ， 则 它们 代表 
着 不 同 的 线程 ， 或 其 中 一 个 代表 着 线程 ， 而 另 一 个 具有 “没有 线程 > 的 值 。 


线程 库 不 限制 你 检查 线程 的 标识 符 是 否 相 同 ，std: :thread: :id 类 型 的 对 象 
提供 了 一 套 完整 的 比较 运算 符 ， 提 供 了 所 有 不 同 值 的 总 排序 。 这 就 允许 它们 在 关 
系 型 容器 中 被 用 作 主 键 ， 或 是 被 排序 ， 或 者 任何 作为 程序 员 的 你 认为 合适 的 方式 
进行 比较 。 比 较 运 算 符 为 std: :thread: :id 所 有 不 相等 的 值 提供 了 一 个 总 的 排 
序 ， 所 以 它们 表现 为 你 直觉 上 期 望 的 那样 : 如 果 axb 且 b<c， 那 么 a<c， 等 等 。 标 
准 库 还 提供 了 std: :hashx<std: :thread: :id>， 使 得 std: :thread: :id 类 型 的 
值 可 在 新 的 无 序 关 系 型 容器 中 作为 主键 来 用 。 


std: :thread: :id 的 实例 常 被 用 来 检查 一 个 线程 是 否 需要 执行 某 些 操作 。 例 
如 ， 如 果 线 程 像 在 清单 2.8 中 那样 的 被 用 来 分 配 工作 ， 启 动 了 其 他 线程 的 初始 线程 
在 需要 做 的 工作 可 能 会 在 算法 中 略 有 不 同 。 在 这 种 情况 下 ， 它 可 以 在 启动 其 他 线 
程 之 前 存储 std: :this_thread: :get_id() 的 结果 ， 然 后 算法 的 核心 部 分 (这 对 
所 有 线程 都 是 公共 的 ) 可 以 对 照 所 存储 的 值 来 检查 自己 的 线程 ID。 


std: :thread::id master thread; 
void some_core_part_of_algorithm() 


| 
if (std::this thread: :get id()==master thread) 
{ 
do master thread workí); 
} 
do common work () ; 
} 


另外 ， 当 前 线程 的 std: : thread: :id 可 以 作为 操作 的 一 部 分 而 存储 在 数据 结 


构 中 。 以 后 在 相同 数据 结构 上 的 操作 可 以 对 照 执 行 此 操作 的 线程 ID 来 检查 所 存储 
的 ID， 来 确定 哪些 操作 是 允许 的 /需要 的 。 


类 似 地 ， 线 程 ID 可 以 指定 的 数据 需要 与 一 个 线程 进行 关联， 并 且 诸如 线程 局 
部 存储 这 样 的 蔡 代 机 制 不 适用 的 地 方 ， 用 作 关 系 型 容器 的 主键 。 例 如 这 样 的 一 个 
com co eaeque QUEM ef 
旦 之 间 传 递 信息 。 


这 种 想法 就 是 ， 在 大 多 数 情 况 下 ，std: :thread: :id 足以 作为 线程 的 通用 标 
识 符 。 只 有 当 标 识 符 具 有 与 其 相关 联 的 语义 《比如 作为 数组 的 索引 ) 时 ， 才 有 必 
要 用 蔡 代 方案 。 你 甚至 可 以 将 一 个 std: :thread: :id 实例 写 到 诸如 std: :cout 这 
样 的 输出 流 中 。 
std: :cout<<std: :this thread: :get 1d); 

你 得 到 的 确切 的 输出 ， 严 格 取 决 于 实现 ， 标 准 给 定 的 唯一 保证 是 ， 比 较 结 果 
相等 的 线程 ID 应 该 产生 相同 的 输出 ， 而 那些 比较 结果 不 相等 的 应 该 给 出 不 同 的 输 
Bs poer MEE M MN Eee 
可 说 的 了 。 


2.6 小结 


在 这 一 章 中 ， 我 介绍 了 线程 管理 与 C++ 标准 库 的 基本 知识 : 启动 线程 ， 等 待 
其 完成 ， 以 及 因为 你 希望 它们 在 后 台 运 行 而 不 等 待 其 完成 。 你 还 看 到 了 如 何在 线 
程 开 始 时 将 参数 传递 给 线程 函数 ， 如 何 将 管理 线程 的 黄 任 从 代码 的 一 个 部 分 转移 
到 男 一 个 部 分 ， 以 及 如 何 用 线程 组 来 做 分 配 工作 。 最 后 ， 我 讨论 了 标识 线程 ， 以 
便 关 联 数据 或 是 不 方便 通过 蔡 代 方法 进行 关联 的 特定 线程 的 行为 。 尽 管 你 可 以 使 
用 运行 在 独立 数据 上 的 完全 独立 的 线程 做 很 多 事情 ， 例 如 在 清单 2.8 中 那样 ， 但 有 
些 时 候 ， 妆 线程 运行 时 在 它们 之 间 共 享 数据 是 更 理想 的 。 第 3 章 围绕 直接 在 线程 
间 共 至 数据 进行 讨论 ， 而 第 4 章 围绕 有 或 没有 共享 数据 的 同步 操作 涵盖 更 一 般 性 


的 问题 。 


第 3 草 ” 在 线程 间 共 孚 数据 
本 章 主要 内 容 


。 线程 间 共享 数据 的 问题 
。 用 互 斥 元 保护 数据 
。 用 于 保护 共享 数据 的 蔡 代 工具 


将 线程 用 作 并 行 的 关键 优点 之 一 ， 是 在 它们 之 间 简 单 、 直 接地 共享 数据 的 潜 
力 。 所 以 既然 我 们 已 经 介绍 了 启动 和 管理 线程 ， 现 在 让 我 们 来 看 看 共享 数据 的 相 


关 问 题 。 


假设 你 正 与 朋友 合租 着 一 套 公 寓 。 公 寓 里 只 有 一 个 厨房 和 一 间 浴 室 。 除 非 你 
们 特别 的 友好 ， 否 则 你 们 不 能 同时 使 用 浴室 。 如 果 你 的 室友 长 时 间 占 据 着 浴室 ， 
当 你 需要 用 它 时 就 会 很 不 爽 。 同 样 地 ， 尽 管 两 人 同时 做 饭 也 是 可 以 的 ， 但 大 是 你 
们 有 一 个 组 合 烤箱 ， 如 果 你 们 中 的 一 个 想 要 烤 香 肠 而 另 一 个 想 要 烘 蛋 糕 ， 这 就 没 
办 法 皆大欢喜 。 此 外 ， 大 家 都 知道 共享 空间 的 挫败 感 ， 以 及 一 个 任务 做 到 一 半 才 
发 现 有 人 借 走 了 我 们 需要 的 东西 ， 或 者 某 件 东西 无 意 中 被 别人 改变 了 。 


这 和 线程 是 相同 的 。 如 果 你 在 线程 之 间 共 台数 据 ， 你 需要 设置 规则 ， 哪 个 线 
程 可 以 访问 数据 的 哪 一 位 ， 什 么 时 间 以 及 如 何 将 更 改 传达 给 关心 此 数据 的 其 他 线 
程 。 在 单个 进程 中 的 多 个 线程 之 间 可 以 轻易 地 共享 数据 不 单纯 是 优点 一 一 它 也 可 
以 是 个 很 大 的 缺点 。 共 享 数 据 的 不 正确 使 用 是 与 并 发 有 关 的 错误 的 最 大 诱因 之 
一 ， 造 成 的 后 果 可 比 香肠 味道 的 蛋糕 糟 多 了 。 


本 章 涉 及 了 在 C++ 线 程 间 安全 地 共享 数据 ， 避 免 可 能 出 现 的 潜在 问题 ， 同 时 
使 收益 最 大 化 。 


3.1 线程 之 间 共 享 数据 的 问题 


从 整体 上 来 看 ， 所 有 线程 之 间 共 享 数据 的 问题 ， 都 是 修改 数据 导致 的 。 如 果 
所 有 的 共享 数据 都 是 只 读 的 ， 就 没有 问题 ， 因 为 一 个 线程 所 读 取 的 数据 不 受 另 
一 个 线程 是 否 正在 读 取 相 同 的 数据 而 影响 〈Ifallshareddataisread-only， 
there'snoproblem,becausethedatareadbyonethreadisunaffectedbywhetherornotano: 
然而 ， 如 果 数 据 是 在 线程 之 间 共 享 的 ， 同 时 一 个 或 多 个 线程 开始 修改 数据 ， 就 可 
能 有 很 多 的 麻烦 。 在 这 种 情况 下 ， 你 必须 要 小 心 确 保 一 切 安 好 。 


一 个 被 广泛 用 来 帮助 程序 员 推 导 代 码 的 概念 ， 就 是 不 变量 (invariants) 一 一 
对 于 特定 的 数据 结构 总 是 为 真 的 语句 ， 例 如 “此 变量 包含 了 列表 中 项 目的 数 
量 。” 这 些 不 变量 在 更 新 中 经 和 常 被 打破 ， 尤 其 是 在 数据 结构 比较 复杂 或 是 更 新 需要 
修改 超过 一 个 值 时 。 


考虑 一 个 双向 链表 ， 它 的 每 一 个 节点 持 有 指向 表 中 下 一 节点 和 前 一 节点 的 指 
针 。 其 中 一 个 不 变量 就 是 如 果 你 跟随 从 一 个 节点 “A)〉 到 男 一 个 节点 (B) 的 “下 
一 个 ”指针 ， 则 那个 节点 〈B) 的 “前 一 个 ”指针 指 回 到 前 一 个 节点 CAD 。 为 了 从 
表 中 删除 一 个 节点 ， 两 边 的 节点 都 必须 被 更 新 为 指向 彼此 。 一 旦 其 中 一 个 被 更 
人 
变量 。 


从 这 样 的 表 中 删 去 一 个 条 目的 步骤 如 图 3.1 所 示 。 

1 标识 要 删除 的 节点 CN) 。 

2 将 N 的 前 一 节点 到 N 的 链接 更 新 为 指向 N 的 后 一 节点 。 
3 将 N 的 后 一 节点 到 N 的 链接 更 新 为 指向 N 的 前 一 节点 。 
4 删除 节点 N。 


如 你 所 见 ， 在 步骤 bp 和 c 之 间 ， 在 一 个 方向 上 的 链接 与 在 相反 的 方向 上 的 链接 
不 一 致 ， 并 且 不 变量 损坏 。 


修改 线程 之 间 共 享 数 据 的 最 简单 的 潜在 问题 就 是 破坏 不 变量 。 如 果 你 没有 为 
确保 其 他 情况 而 做 些 特别 的 工作 ， 要 是 一 个 线程 正在 读 取 双 向 链表 ， 而 另 一 个 线 
程 正 在 删除 一 个 节点 ， 那 么 读 线 程 很 有 可 能 看 到 一 个 节点 仅 被 部 分 删除 了 的 链表 
(因为 在 图 3.1 的 步骤 b 中 ， 只 有 其 中 一 个 链接 被 改变 了 ) ， 因 此 不 变量 损坏 。 不 
变量 损坏 的 后 果 可 能 有 所 不 同 ， 如 果 其 他 线程 只 是 在 图 中 由 左 到 右 读 取 链 表 项 ， 
它 会 跳 过 正 被 删除 的 节点 。 另 一 方面 ， 如 果 又 一 个 线程 试图 删除 图 中 最 右边 的 节 
点 ， 则 可 能 最 终 永 和 久 性 破坏 数据 结构 ， 并 使 得 程序 骨 溃 。 无 论 结果 如 何 ， 这 是 并 
发 代码 中 错误 的 最 常见 诱因 之 一 的 例子 : 竞争 条 件 Cracecondition) 。 


= | H = 
s ke s hke 
a) 


b) 
c) 


d) 


图 3.1 ”从 双向 链表 中 删除 一 个 节点 


3.1.1 竞争 条 件 


假设 你 在 电影 院 买 票 看 电影 。 如 果 是 个 大 电影 院 ， 会 有 多 个 收银 员 收 蒜 ， 所 
以 不 止 一 个 人 可 以 同时 买 票 。 如 果 有 人 在 另 一 个 收银 台 也 购买 了 与 你 同一 部 电影 
的 票 ， 这 时 可 供 你 选择 的 座位 取决 于 事实 上 是 其 他 人 先 订 购 还 是 你 先 订 购 。 如 果 
只 剩 少量 座位 ， 这 种 差异 可 能 会 很 关键 。 字 面 上 可 以 看 作 一 个 比赛 ， 看 谁 得 到 最 
后 的 电影 票 。 这 是 一 个 竞争 条 件 (racecondition) 的 例子 : 得 到 哪个 座位 (或 者 
甚至 是 否 得 到 票 ) 取决 于 两 次 购买 的 相对 顺序 。 


在 并 发 性 中 ， 竞 争 条 件 就 是 结果 取 雇 于 两 个 或 更 多 线程 上 的 操作 执行 的 相对 
顺序 的 一 切 事 物 。 线 程 竞 争执 行 各 目的 操作 。 在 大 多 数 情 况 下 ， 这 是 比较 恨 性 
的 ， 因 为 所 有 可 能 的 结果 都 是 可 以 接受 的 ， 尽 管 他 们 可 能 会 随 着 不 同 的 相对 顺序 
而 改变 。 例 如 ， 如 果 两 个 线程 都 将 项 目 添加 到 一 个 队列 中 等 竺 处理 ， 在 保持 系统 
不 变量 的 前 提 下 ， 哪 个 项 目 先 被 添加 一 般 是 不 影响 的 。 当 竞争 条 件 导 致 损坏 不 变 
量 时 才 会 出 现 问 题 ， 以 刚才 提 到 的 双 回 链表 为 例 。 在 谈 到 并 发 时 ， 术 语 竞争 条 件 
(racecondition) 通 芝 用 来 表示 有 问题 的 (problematic) 竞争 条 件 。 恨 性 的 竞争 
条 件 没什么 意思 ， 也 不 是 错误 的 诱因 。C++ 标 准 还 定义 了 术语 数据 竞争 
(datarace) ， 表 示 因 对 单个 对 象 的 并 发 修改 而 产生 的 特定 类 型 的 竞争 条 件 〈 参 
见 5.1.2 节 ) ， 数 据 竞 争 造 成 可 怕 的 未 定义 行为 undefinedbehavior ) . 


有 问题 的 竞争 条 件 通 常 友 生 在 完成 操作 需要 修改 两 个 或 多 个 不 同 的 数据 块 的 
地 方 ， 就 如 示例 中 的 两 个 链表 指针 。 因 为 该 操作 必须 访问 两 块 独立 的 数据 ， 这 必 
须 在 单独 的 指令 中 进行 修改 ， 而 当 只 有 其 中 一 条 指令 完成 时 ， 男 一 个 线程 有 可 能 
访问 此 数据 结构 。 竞 争 条 件 往往 很 难 找 到 且 难 以 复制 ， 因 为 机 遇 的 窗口 很 小 。 如 
果 这 些 修 改作 为 连续 的 CPU 指令 来 完成 ， 在 任意 一 次 运行 中 显现 问题 的 机 会 是 非 
常 小 的 ， 即 使 数据 结构 正 被 另 一 个 线程 并 发 访问 。 随 着 系统 上 负载 的 升 高 ， 以 及 
执行 该 操作 次 数 的 增加 ， 有 问题 的 执行 序列 出 现 的 机 会 也 增加 。 这 种 问题 几乎 是 
不 可 避免 地 会 在 最 不 方便 的 时 间 暴 露出 来 。 由 于 竞争 条 件 一 般 是 时 间 人 敏感 的 ， 它 
们 第 常 在 应 用 程序 运行 于 调试 工具 下 时 完全 消失 ， 因 为 调试 工具 会 影 啊 程序 的 时 
间 ， 即 使 只 是 轻微 地 。 


如 果 你 正在 编写 多 线程 程序 ， 苋 争 条 件 会 轻易 地 成 为 你 生活 的 灾难 。 编 写 使 
用 并 发 的 软件 中 大 量 的 复杂 性 来 源 于 避免 有 问题 的 竞争 条 件 。 


3.1.2 ”避免 有 问题 的 竞争 条 件 


有 几 种 方法 来 处 理 有 问题 的 竞争 条 件 。 最 简单 的 选择 是 用 保护 机 制 封 装 你 的 
数据 结构 ， 以 确保 只 有 实际 执行 修改 的 线程 能 够 在 不 变量 损坏 的 地 方 看 到 中 间 数 
据 。 从 其 他 访问 该 数据 结构 线程 的 角度 看 ， 这 种 修改 要 么 还 没 开 始 要 么 已 完成 。 
C ++ 标 准 库 提 供 了 一 些 这 样 的 机 制 ， 在 本 章 中 均 有 述 及 。 


男 一 个 选择 是 修改 数据 结构 的 设计 及 其 不 变量 ， 从 而 令 修改 作为 一 系列 不 可 
分 割 的 变更 来 完成 ， 每 个 修改 均 保留 其 不 变量 。 这 通常 被 称 为 无 锁 编程 Clock- 
freeprogramming) ， 且 难以 尽善尽美 。 如 果 你 工作 在 这 个 级 别 上 ， 内 存 模 型 的 
细微 差异 和 确认 哪些 线程 可 能 看 到 哪 组 值 ， 会 变 得 很 复杂 。 内 存 模 型 在 第 5 章 中 


阐述 ， 而 无 锁 编 程 在 第 7 章 中 进行 讨论 。 


处 理 竞争 条 件 的 另 一 种 方式 是 将 对 数据 结构 的 更 新 作为 一 个 事务 
(transaction) 来 处 理 ， 就 如 同 在 一 个 事务 内 完成 数据 库 的 更 新 一 样 。 所 需 的 一 
系列 数据 修改 和 读 取 被 存储 在 一 个 事务 日 志 中 ， 然 后 在 单个 步骤 中 进行 提交 。 如 
果 该 提交 因为 数据 结构 已 被 男 一 个 线程 修改 而 无 法 进行 ， 该 事务 将 重新 启动 。 这 
称 为 软件 事务 内 存 (softwaretransactionalmemory, STM) ， 在 写作 时 这 是 一 个 
活跃 的 研究 领域 。 这 在 本 书 中 不 会 述 及 ， 因 为 在 C++ 中 没有 对 STM 的 直接 文 持 。 
然而 ， 私 下 里 做 些 事情 然后 在 单个 步骤 中 提交 的 基本 思想 ， 我 会 在 后 面 提 到 。 


由 C++ 标准 提供 的 保护 共享 数据 的 最 基本 机 制定 互 斥 元 (mutex) , AAR 
们 先 来 看 一 看 。 


3.2 ”用 互 斥 元 保护 共 孚 数据 


于 是 ， 你 有 一 个 类 似 于 上 一 节 中 链表 那样 的 共享 数据 结构 ， 你 想 要 保护 它 免 
于 竞争 条 件 以 及 可 能 因此 产生 的 不 变量 损坏 。 如 果 你 可 以 将 所 有 访问 该 数据 结构 
的 代码 块 标记 为 互 斥 的 Cnutuallyexclusive) ， 岂 不 是 很 好 ? 如 果 任 何 线程 运行 
了 其 中 之 一 ， 所 有 其 他 试图 访问 此 数据 结构 的 线程 就 必须 一 直 等 到 第 一 个 线程 完 
成 。 这 就 使 得 线程 不 可 能 看 到 损坏 的 不 变量 ， 除 非 它 是 进行 修改 的 线程 。 


咖 ， 这 并 非 无 智之 谈 一 一 它 正 是 使 用 称 为 互 斥 元 (mutex, mutualexclusion ) 
的 同步 原 语 所 能 得 到 的 。 在 访问 共享 数据 结构 之 前 ， 锁 定 〈lock) 与 该 数据 相关 
HH Fo. Muss. RESO (unlock) 该 互 斥 元 。 线 程 库 会 确保 一 
且 一 个 线程 已 经 锁定 某 个 互 斥 元 ， 所 有 其 他 试图 锁定 相同 互 斥 元 的 线程 必须 等 
待 ， 直 到 成 功 锁 定 了 该 互 斥 元 的 线程 解锁 此 互 斥 元 。 这 就 确保 所 有 线程 看 到 共享 
数据 自 洽 的 一 面 ， 不 带 有 任何 损坏 的 不 变量 。 


互 斥 元 是 C++ 中 最 常见 的 数据 保护 机 制 ， 但 并 非 灵 丹 妙 药 。 精 心 组 织 代码 来 
保护 正确 的 数据 (参见 3.2.2 节 〉 以 及 避免 接口 中 固有 的 竞争 条 件 〈 参 见 3.2.3 节 ) 
也 是 很 重要 的 。 互 斥 元 也 伴随 着 自己 的 问题 ， 以 死 锁 〈deadlock) (2 7.32.4 
ie 和 保护 过 多 或 过 少数 据 〈 参 见 3.2.8 节 ) 的 形式 。 接 下 来 ， 让 我 们 从 基础 开 


3.2.1 使 用 C++ 中 的 互 斥 元 


在 C++ 中 ， 通 过 构造 std: :mutex 的 实例 创建 互 斥 元 ， 调 用 成 员 函 数 lock() 
来 锁定 它 ， 调 用 成 员 函 数 unlock() 来 解锁 它 。 然 而 ， 直 接 调用 成 员 函 数 是 不 推荐 
的 做 法 ， 因 为 这 意味 着 你 必须 记 住 在 离开 函数 的 每 条 代码 路 径 上 都 调 
用 unlock()， 包 括 由 于 异常 所 导致 的 在 内 。 作 为 蔡 代 ， 标 准 C ++ 库 提供 了 
std: :lock_guard 类 模板 ， 实 现 了 互 斥 元 的 RAII 惯 用 语法 ; 它 在 构造 时 锁定 所 给 
的 互 太 元， 在 析 构 时 将 互 斥 元 解锁 ， 从 而 保证 被 锁定 的 互 斥 元 始终 被 正确 解锁 。 
清单 3.1 的 代码 展示 了 如 何 使 用 std: :mutex 保 护 一 个 可 被 多 个 线程 访问 的 列表 ， 
连同 std: :lock_guard。 二 者 都 声明 于 <mutex> 头 文件 中 。 


清单 3.1 用 互 斥 元 保护 列表 


#include <list> 
#include <mutex> 
#include <algorithm> 


std::list<int> some list; 0 
std: :mutex some_mutex; O 


void add to listí(int new value) 

| 
std::lock guard«std::mutex» guard (some_mutex) ; «—9 
some list.push back {new value); 


} 


bool list_contains (int value_to_find) 


i = 
std::lock_guard<std: :mutex> guard (some_mutex) ; 
return std::find(some list.begin(),some list.end(),value to find) 
12 some list.end(); 


在 清单 3.1 中 ， 有 一 个 全 局 变量 @， 它 被 相应 的 std: :mutex 的 全 局 实例 @ 保 
护 。 在 add_to_list() 合 以 及 list_contains() 信 中 对 
std::lock guard«std: :mutex> 的 使 用 意味 着 这 些 函数 中 的 访问 是 互 斥 
的 ，1ist_contains() 将 无 法 在 add_to_1list() 进 行 修改 的 半途 中 看 到 该 列表 。 


尽管 这 种 全 局 变量 的 使 用 偶尔 也 是 恰当 的 ， 在 大 多 数 情 况 下 ， 不 用 全 局 变 
量 ， 而 是 在 类 中 将 互 斥 元 和 受 保护 的 数据 组 织 在 一 起 ， 是 很 普 衣 的。 这 是 一 个 标 
准 的 面向 对 象 应 用 程序 设计 规则 ， 通 过 将 它们 放 在 一 个 类 中 ， 清 楚 地 标记 他 们 是 
相关 的 ， 还 可 以 封装 函数 以 及 强制 保护 。 在 这 种 情况 下 ， 函 数 add_to_1ist 和 
list_contains 将 成 为 类 的 成 员 函 数 ， 互 斥 元 和 受 保 护 的 数据 都 作为 类 的 
private 成 员 ， 使 其 更 容易 鉴别 哪些 代码 可 以 访问 数据 ， 哪 些 代码 需要 锁定 互 斥 
元 。 如 果 类 的 所 有 成 员 函 数 在 访问 任意 其 他 数据 成 员 之 前 锁定 互 太 元 ， 并 且 在 操 
作 完 成 时 解锁 ， 则 数据 对 于 所 有 的 访问 者 都 被 很 好 地 保护 了 。 


其 实 ， 并 不 完全 是 那样 ， 你 将 敏锐 地 及 现 ， 如 果 其 中 一 个 成 员 函 数 返 回 对 受 
保护 数据 的 指针 或 引用 ， 那 么 所 有 成 员 函 数 都 以 良好 顺序 的 方式 锁定 互 斥 元 也 是 
没关系 的 ， 因 为 你 已 在 保护 中 捅 了 一 个 大 定 隆 。 能 够 访问 (并 可 能 修改 ) 该 指针 
或 引用 的 任意 代码 现在 可 以 访问 受 保护 的 数据 而 无 需 锁 定 该 互 斥 元 。 因 此 使 用 
互 斥 元 保护 数据 需要 仔细 设计 接口 ， 以 确保 在 有 任意 对 受 保护 的 数据 进行 访问 之 
前 ， 互 斥 元 已 被 锁定 ， 且 不 留 后 门 。 


3.2.2 ”为 你 护 共 孚 数据 精心 组 织 代码 


如 你 所 见 ， 用 互 斥 元 保护 数据 并 不 只 是 像 在 每 个 成 员 函 数 中 拍 进 一 
个 std: :lock_guard 对 象 那样 容易 ， 一 个 迷路 的 指针 或 引用 ， 所 有 的 保护 都 将 白 


费 。 在 一 个 层面 上 ， 检 查 迷 路 的 指针 或 引用 是 容易 的 ， 只 要 没有 一 个 成 员 函 数 通 
过 其 返回 值 或 输出 参数 ， 返 回 受 保护 数据 的 指针 或 引用 给 其 调用 者 ， 数 据 就 安全 
了 。 如 果 更 深入 一 些 ， 它 没有 那么 直观 一 一 远 远 没有 。 除 了 检查 成 员 函 数 没有 疝 
其 调用 者 传 出 指针 和 引用 ， 检 查 它们 没有 向 其 调用 的 不 在 你 掌控 之 下 的 函数 传 入 
这 种 指针 和 引用 ， 也 是 很 重要 的 。 这 同样 危险 ， 那 些 函 数 可 能 将 指针 和 引用 存储 
在 某 个 地 方 ， 将 来 可 以 脱离 互 斥 元 的 保护 而 被 使 用 。 在 这 方面 特别 危险 的 是 ， 孙 
数 是 通过 函数 参数 或 其 他 方式 在 运行 时 提供 的 ， 如 清单 3.2 所 示 。 


清单 3.2 意外 地 传 出 对 受 保护 数据 的 引用 


class some data 
{ 
int a; 
std::string b; 
public: 
void do something(); 
}; 
class data_wrapper 
{ 
private: 
some data data; 
std::mutex m; 
public: 
template<typename Function» 
void process data(Function func) 
{ 
std::lock_guard<std::mutex> 1(m) ; [1] 传递 “ 受 保 护 的 ”数据 到 
func (data) ; «— 用 户 提供 的 函数 
} 
}; 


some_data* unprotected; 


void malicious function(some data& protected data) 


( 


unprotected=&protected data; 


) 


data wrapper x; 


void foo() 传人 一 个 悉 意 

{ 函数 对 受 保护 的 数据 
x.process data(malicious function); < 进行 未 受 保 护 的 
unprotected-»do something(); + 访问 


) 


在 这 个 例子 中 ，process_data 中 的 代码 看 起 来 挺 无 害 ， 受 
到 std: :lock_guard 很 好 地 保护 ， 但 对 用 户 提 供 的 函数 func 的 调用 @ 意 味 着 foo 
可 以 传 入 malicious_function 灸 来 绕 过 保护 ， 然 后 无 需 锁 定 互 斥 元 即 可 调 
Hjdo something()6. 


从 根本 上 说 ， 这 个 代码 的 问题 在 于 它 没有 完成 你 所 设置 的 内 容 ， 标 记 所 有 访 
问 该 数据 结构 的 代码 为 互 斥 的 《mutuallyexclusive〉。 在 这 个 例子 中 ， 和 忽略 了 
foo() 中 调用 unprotected->do_something() 的 代码 。 不 幸 的 是 ， 这 部 分 问题 


不 是 C++ 线 程 库 所 能 帮助 你 的 ， 而 这 取决 于 作为 程序 员 的 你 ， 去 锁定 正确 的 互 斥 
元 来 保护 你 的 数据 。 想 想 好 的 一 面 ， 你 有 了 一 个 可 遵循 的 准则 ， 它 会 在 这 些 情 况 
下 帮助 你 : 不 要 将 对 受 保护 数据 的 指针 和 引用 传递 到 锁 的 范围 之 外 ， 无 论 是 通 
将 其 存放 在 外 部 可 见 的 内 存 中 ， 还 是 作为 参数 传递 给 用 
户 提供 的 函数 。 


虽然 这 是 在 试图 使 用 互 斥 元 来 保护 共享 数据 时 第 犯 的 错误 ， 但 这 绝 非 唯一 可 
在 下 一 节 中 你 会 看 到 ， 可 能 仍然 会 有 竞争 条 件 ， 即 便当 数据 被 互 斥 元 
PE o 


3.2.3 ”发 现 接 口中 国有 的 竞争 条 件 


仅仅 因为 使 用 了 互 斥 元 或 其 他 机 制 来 保护 共享 数据 ， 未 必 会 免 于 竞争 条 件 ， 
你 仍然 需要 确定 保护 了 适当 的 数据 。 再 次 考虑 双 回 链表 的 例子 。 为 了 让 线程 安全 
地 删除 节点 ， 你 需要 确保 已 阻止 对 三 个 结 点 的 并 发 访问 。 要 删除 的 节点 及 其 两 边 
的 结 点 。 如 果 你 分 别 保护 访问 每 个 节点 的 指针 ， 就 不 会 比 未 使 用 互 斥 元 的 代码 更 
好 ， 因 为 竞争 条 件 仍 会 发 生 一 一 需要 保护 的 不 是 个 别 步 骤 中 的 个 别 结 点 ， 而 是 整 
个 删除 操作 中 的 整个 数据 结构 。 这 种 情况 下 最 简单 的 解决 办 法 ， 融 是 用 单个 互 斥 
元 保护 整个 列表 ， 如 清单 3.1 中 所 示 。 


仅仅 因为 在 列表 上 的 个 别 操 作 是 安全 的 ， 你 还 没有 摆脱 困境 。 你 仍然 会 遇 到 
竞争 条 件 ， 即 便 是 一 个 非常 简单 的 接口 。 考 虑 像 std: : stack 容 器 适配器 这 样 的 
堆栈 数据 结构 ， 如 清单 3.3 中 所 示 。 除 了 构造 函数 和 swap()， 对 std: :stack 你 只 
有 五 件 事情 可 以 做 : 可 以 push() 一 个 新 元 素 入 栈 、pop() 一 个 元 素 出 栈 、 读 
top() 元 素 、 检 查 它 是 否 empty() 以 及 读 取 元 素数 量 堆栈 的 size()。 如 果 更 
改 top() 使 得 它 返 回 一 个 副本 ， 而 不 是 引用 《这 样 你 就 遵循 了 3.2.2 节 的 准则 ) ， 
同时 用 互 斥 元 保护 内 部 数据 ， 该 接口 依然 固有 地 受制 于 竞争 条 件 。 这 个 问题 对 基 
于 互 斥 元 的 实现 并 不 是 独一无二 的 。 它 是 一 个 接口 问题 ， 因 此 对 于 无 锁 实 现 仍然 
会 发 生 竞 争 条 件 。 


清单 3.3 std::stack 容 器 适配器 的 接口 


template«typename T,typename Container=std: :deque<T> > 

class stack 

{ 

public: 
explicit stack(const Container&); 
explicit stack(Container&& = Container()); 
template «class Alloc» explicit stack{const Alloc&); 
template «class Alloc» stackí(const Container&, const Alloc&); 
template «class Alloc» stackí(Container&&, const Allocé&); 
template <class Alloc» stack(stack&&, const Alloc&); 


bool emptyí) const; 
size t size() const; 
T& top(); 

T const& top() const; 
void push(T const&); 
void push(T&&); 

void pop(); 

void swap(stack&&); 


y; 


这 里 的 问题 是 empty() 的 结果 和 size() 不 可 靠 。 虽然 它们 可 能 在 被 调用 时 是 
正确 的 ， 一 旦 它们 返回 ， 在 调用 了 empty() 或 size( ) 的 线程 可 以 使 用 该 信息 之 
Eee 人 并 且 可 能 push( ) 新 元 素 入 栈 或 pop() 已 有 的 
元 素 出 栈 


特别 地 ， 如 果 该 stack 实 例 是 非 共 享 的 ， 如 果 栈 非 空 ， 检 查 empty() 并 调 
用 top() 访 问 顶 部 元 素 是 安全 的 ， 如 下 所 示 。 


stack«int» s; 


if(Is.empty()) <0 
{ 


int const value-s.top(); a. 


s.pop(); «9 


do something(value); 


它 不 仅 在 单线 程 代码 中 是 安全 的 ， 预 计 为 : 在 空 堆栈 上 调用 top() 是 未 定义 
的 行为 。 对 于 共享 的 stack 对 象 ， 这 个 调用 序列 不 再 安全 ， 因 为 在 调 
用 empty()@ 和 调用 top( ) 人 @ 之 间 可 能 有 来 自 男 一 个 线程 的 pop( ) 调 用 ， 删 除 最 后 
一 个 元 素 。 因 此 ， 这 是 一 个 典型 的 竞争 条 件 ， 为 了 保护 栈 的 内 容 而 在 内 部 使 用 互 
斥 元 ， 却 并 未 能 将 其 阻止 ， 这 就 是 接口 的 影响 。 


怎么 解决 昵 ? 发 生 这 个 问题 是 接口 设计 的 后 果 ， 所 以 解决 办 法 就 是 改变 接 
口 。 然 而 ， 这 仍然 回避 了 问题 ， 要 作出 什么 样 的 改变 ? 在 最 简单 的 情况 下 ， 你 只 
要 声明 top() 在 调用 时 如 果 栈 中 没有 元 素 则 引发 异常 。 虽 然 这 直接 解决 了 问题 ， 
但 它 使 编程 变 得 更 麻烦 ， 因 为 现在 你 得 能 捕捉 异常 ， 即 使 对 empty() 的 调用 返回 
false。 这 基本 上 使 得 empty() 的 调用 变 得 纯粹 多 余 。 


如 果 你 仔细 看 看 前 面 的 代码 片段 ， 还 有 必 一 个 可 能 的 竞争 条 件 ， 但 这 一 次 是 
在 调用 top( ) 信 和 调用 pop( )@ 之 间 。 考 虑 运行 着 前 面 代码 片段 的 两 个 线程 ， 它 
们 都 引用 着 同一 个 stack 对 象 s。 这 并 非 罕见 的 情形 ， 当 为 了 性 能 而 使 用 线程 时 ， 
有 数 个 线程 在 不 同 的 数据 上 运行 相同 的 代码 是 很 常见 的 ， 并 且 一 个 共享 的 stack 
对 象 非常 适合 用 来 在 它们 之 间 分 隔 工 作 。 假 设 一 开始 栈 里 有 两 个 元 素 ， 那 么 你 不 
用 担心 在 任 一 线程 上 的 empty() 和 top() 之 间 的 竞争 ， 只 需 考虑 可 能 的 执行 模 


A. 


如 果 栈 从 内 部 被 互 斥 元 保护 ， 只 有 一 个 线程 可 以 在 任何 时 间 运 行 栈 的 成 员 函 
数 ， 那 么 这 些 调用 就 能 得 以 很 好 地 交错 ， 而 对 do_something() 的 调用 可 以 同时 
运行 。 一 个 可 能 的 执行 正如 表 3.1 所 示 。 


表 3.1 两 个 线程 堆栈 上 可 能 的 操作 顺序 


线程 A 


if(!s.empty()) 
if(!s.empty()) 
int const value = s.top(); 


int const value - s.top(); 


s.pop(); 
do_something(value); s.pop(); 
do. something(value); 


QOPR ATL, WRR ENAA IN EIST RFE, ZED KIA HI top ) 修 改 该 栈 之 
间 没 有 任何 东西 ， 所 以 这 两 个 线程 将 看 到 相同 的 值 。 不 仅 如 此 ， 在 pop() 的 两 次 
调用 之 间 没 有 对 top() 的 调用 。 因 此 ， 栈 上 的 两 个 值 其 中 一 个 还 没 被 读 取 束 被 丢 
弃 了 ， 而 另 一 个 被 处 理 了 两 次 。 这 是 另 一 种 竞争 条 件 ， 远 比 empty()/top() 竞 争 
的 未 定义 行为 更 槽 糕 。 从 来 没有 任何 明显 的 错误 发 生 ， 同 时 错误 造成 的 后 果 可 能 
和 诱因 差距 其 远 ， 尽 管 他 们 明显 取决 于 do_something() 到 底 做 什么 。 


这 要 求 对 接口 进行 更 加 激进 的 改变 ， 在 互 斥 元 的 保护 下 结合 对 top() 和 
pop() 两 者 的 调用 。Tom Cargillt 指 出 ， 如 果 栈 上 对 象 的 拷贝 构造 函数 能 够 引发 
异常 ， 结 合 调用 可 能 会 导致 问题 。 从 Herb Sutterl2] 的 异常 安全 的 观点 来 看 ， 这 个 
问题 被 处 理 得 较为 全 面 ， 但 潜在 的 竞争 条 件 为 这 一 结合 带 来 了 新 的 东西 。 


对 于 那些 尚未 意识 到 这 个 问题 的 人 ， 考 虑 一 下 stack<vector<int>>。 现 
在 ，vector 是 一 个 动态 大 小 的 容器 ， 所 以 当 你 复制 vector 时 ， 为 了 复制 其 内 
容 ， 库 就 必须 从 堆 中 分 配 更 多 的 内 存 。 如 果 系 统 负载 过 重 ， 或 有 明显 的 资源 约 
束 ， 此 次 内 存 分 配 就 可 能 失败 ， 于 是 vector 的 拷贝 构造 函数 可 能 引发 
std: :bad_alloc 异 常 。 如 果 vector 中 含有 大 量 的 元 素 的 话 则 尤其 可 能 。 如 果 
pop() 函 数 被 定义 为 返回 出 栈 值 ， 并 且 从 栈 中 删除 它 ， 就 会 有 潜在 的 问题 。 仅 在 
栈 被 修改 后 ， 出 栈 值 才 返回 给 调用 者 ， 但 复制 数据 以 返回 给 调用 者 的 过 程 可 能 会 
引发 异常 。 如 果 发 生 这 种 情况 ， 刚 从 栈 中 出 栈 的 数据 会 丢失 ， 它 已 经 从 栈 中 被 删 
除了 ， 但 该 复制 却 没 成 功 ! std: :stack 接口 的 设计 者 笼统 地 将 操作 一 分 为 二 。 
获取 顶部 的 元 素 (top()) ， 然 后 将 其 从 栈 中 删除 Coop()) ， 以 致 于 你 无 法 安 
全 地 复制 数据 ， 它 将 留 在 栈 上 。 如 果 问 题 是 堆 内 存 不 足 ， 也 许 应 用 程序 可 以 释放 
一 些 内 存 ， 然 后 再 试 一 次 。 


不 幸 的 是 ， 这 种 划分 正 是 你 在 消除 苋 搜 条 件 中 试图 去 避免 的 ! 值得 庆幸 的 
是 ， 还 有 丛 代 方案， 但 他 们 并 非 无 代价 的 。 


1. 选项 1: 传 入 引用 


第 一 个 选项 是 把 你 希望 接受 出 栈 值 的 变量 的 引用 ， 作 为 参数 传递 给 对 pop () 
的 调用 。 


std: :vector<int> result; 
some stack.popíresult); 


这 在 很 多 情况 下 都 适用 ， 但 它 有 个 明显 的 缺点 ， 要 求 调用 代码 在 调用 之 前 先 
构造 一 个 该 栈 值 类 型 的 实例 ， 以 便 将 其 作为 目标 传人 入。 对 于 某 些 类 型 而 言 这 是 行 
不 通 的 ， 因 为 构造 一 个 实例 在 时 间 和 资源 方面 是 非常 昂贵 的 。 对 于 其 他 类 型 ， 这 
并 不 总 是 可 能 的 ， 因 为 构造 函数 需要 参数 ， 而 在 代码 的 这 个 位 置 不 一 定 可 用 。 最 
后 ， 它 要 求 所 存储 的 类 型 是 可 赋值 的 。 这 是 一 个 重要 的 限制 。 许 多 用 户 定义 的 类 
型 不 文 持 赋 值 ， 尽 管 它们 可 能 文 持 移动 构造 函数 ， 或 者 甚至 是 拷贝 构造 函数 〈 从 
而 允许 通过 值 来 返回 ) 。 


2. 选项 2: 要 求 不 引发 异常 的 拷贝 构造 函数 或 移动 构造 函数 


对 于 有 返回 值 的 pop() 而 言 只 有 一 个 异常 安全 问题 ， 就 是 以 值 进行 的 返回 可 
能 引发 异 闸 。 许 多 类 型 具有 不 引发 异 第 的 拷贝 构造 函数 ， 并 且 在 C++ 标 准 中 有 了 
新 的 右 值 引用 的 支持 (参见 附录 A 中 A.1 节 ) ， 越 来 越 多 的 类 型 将 不 会 引发 异常 的 
移动 构造 沙 数 ， 即 便 他 们 的 拷贝 构造 函数 会 如 此 。 一 个 有 效 的 选择 ， 就 是 把 对 线 
程 安全 堆栈 的 使 用 ， 限 制 在 能 够 安全 地 通过 值 来 返回 且 不 引发 异常 的 类 型 之 内 。 


虽然 这 样 安 全 了 ， 但 并 不 理想 。 尽 管 你 可 以 在 编译 时 使 
用 std: :is nothrow copy constructiblejl 
std::is_nothrow_move_constructible 类 型 特征 ， 来 检测 一 个 不 引发 异常 的 


拷贝 或 移动 构造 函数 的 存在 ， 但 这 却 很 受 限制 。 相 比 于 具有 不 能 引发 异常 的 拷贝 
和 /或 移动 构造 沙 数 的 类 型 ， 有 更 多 的 用 户 定 义 类 型 具有 能 够 引发 异常 的 拷贝 构造 
函数 且 没 有 移动 构造 函数 〈 尽 管 这 会 随 着 人 们 习惯 了 C ++11 中 对 右 值 引用 的 文 持 
而 改变 ) 。 如 果 这 种 类 型 不 能 被 存储 在 你 的 线程 安全 堆栈 中 ， 是 不 幸 的 。 


3. 选项 3: 返回 指向 出 栈 项 的 指针 


第 三 个 选择 是 返回 一 个 指向 出 栈 项 的 指针 ， 而 非 通 过 值 来 返回 该 项 。 其 优点 
是 指针 可 以 被 自由 地 复制 而 不 会 引发 异常 ， 这 样 你 就 避免 了 Cargill 的 异常 问题 。 
其 缺点 是 ， 返 回 一 个 指针 时 需要 一 种 手段 来 管理 分 配给 对 象 的 内 存 ， 对 于 像 整 数 
这 样 简 单 的 类 型 ， 这 种 内 存 管理 的 成 本 可 能 会 超过 仅 通 过 值 来 返回 该 类 型 。 对 于 
任何 使 用 此 选项 的 接口 ，std: :shared_ptr 会 是 指针 类 型 的 一 个 好 的 选择 。 它 不 
仅 避 免 了 内 存 汇 漏 ， 因 为 一 旦 最 后 一 个 指针 被 销毁 则 该 对 象 也 会 被 销毁 ， 并 且 库 
可 以 完全 控制 内 存 分 配方 案 且 不 必 使 用 new 和 delete。 对 于 优化 用 途 来 说 这 是 很 
重要 的 ， 要 求 用 new 分 别 分 配 堆 栈 中 的 每 一 个 对 象 ， 会 比 原来 非 线 程 安全 的 版 本 
带 来 大 得 多 的 开销 。 

4. 选项 4: 同时 提供 选项 1 以 及 2 或 3 

灵活 性 永远 不 应 被 排除 在 外 ， 特 别 是 在 通用 的 代码 中 。 如 果 你 选择 选项 2 或 
3， 那 么 同时 提供 选项 1 也 是 相对 容易 的 ， 这 也 为 你 的 代码 的 用 户 提供 了 选择 的 能 
力 ， 为 了 很 小 的 额外 成 本 ， 哪 个 选项 对 他 们 是 最 适合 的 。 

5. 一 个 线程 安全 堆栈 的 示范 定义 

清单 3.4 展 示 了 在 接口 中 没有 竞争 条 件 的 栈 的 类 定义 ， 实 现 了 选项 1 和 
3。pop() 有 两 个 重 载 ， 一 个 接受 存储 该 值 的 位 置 的 引用 ， 另 一 个 返回 std: : 
shared_ptr<c>。 它 具有 一 个 简单 的 接口 ， 只 有 两 个 函数 ，push() 和 pop()。 


清单 3.4 一 个 线程 安全 栈 的 概要 类 定义 


#include <exception> 
#include <memory> 


< 
- | For std::shared_ptr<> 
struct empty stack: std::exception 
( 

const char* whatí() const throw(); 


} 


template<typename T> 
class threadsafe stack 赋值 运算 符 被 删除 了 
{ 
public: 
threadsafe stackí); 
threadsafe stackí(const threadsafe stack&); 
threadsafe stack& operator- (const threadsafe stack&) = delete; <= 


void push(T new value); 
std::shared_ptr<T> pop(); 
void pop(T& value) ; 

bool empty() const; 


通过 削减 接口 ， 你 考虑 到 了 最 大 的 安全 性 ， 其 至 对 整个 堆栈 的 操作 都 受到 限 
制 。 栈 本 身 不 能 被 赋值 ， 因 为 赋值 运算 符 被 柚 除 @ (参见 附录 A 中 A.2 季 ) ， 而 且 
也 没有 swap() 函 数 。 然 而 ， 它 可 以 被 复制 ， 假 设 栈 的 元 素 可 以 被 复制 。 如 果 栈 是 
空 的 ，pop() 函 数 引 发 一 个 empty_stack 异 常 ， 所 以 即使 在 调用 empty( ) 后 栈 被 
修改 ， 一 切 仍 将 正常 工作 。 正 如 选项 3 的 描述 中 提 到 的 ， 如 果 需 
要 ，std: :shared_ptr 的 使 用 允许 栈 来 处 理 内 存 分 配 问题 ， 同 时 避免 对 new 和 
delete 的 过 多 调用 。 五 个 堆栈 操作 现在 变 成 三 个 ，push()、pop() 和 empty()。 
甚至 empty() 都 是 多 余 的 。 接 口 的 简化 可 以 更 好 地 控制 数据 。 你 可 以 确保 互 斥 元 
为 了 操作 的 整体 而 被 锁定 。 清 单 3.5 展 现 了 一 个 简单 的 实现 ， 一 个 围绕 
std: :stack<> 的 封装 器 。 


清单 3.5 一 个 线程 安全 栈 的 详细 类 定义 


#include <exception> 
#include <memory> 
#include <mutex> 
#include <stack> 


struct empty_stack: std::exception 


{ 
) 


template-typename T> 
class threadsafe stack 


( 


private: 
std::stack«T» data; 
mutable std::mutex m; 
public: 
threadsafe stack()() 
threadsafe stack(const threadsafe stack& other) 


{ 


const char* what() const throw(); 


std::lock guard«std::mutex» lock(other.m); 在 构造 函数 体 中 
data-other.data; 执行 复制 

} 

threadsafe stack& operator-(const threadsafe stack&) = delete; 


void push(T new value) 


std::lock guard«std::mutex» lock (m); 
data.pushí(new value); 


} 


std::shared_ptr<T> pop() 


在 试 着 出 术 值 的 时 候 检 
std::lock_guard<std::mutex> lock (m); 查 是 否 为 空 
if (data.empty()) throw empty stack(); 
std::shared_ptr<T> const res(std::make shared«T» (data.top())); «4 
data.pop(); 
return res; 33, 
在 修改 栈 之 前 


} - 

void pop(T& value) 分 配 返 回 什 
std::lock_guard<std::mutex> lock (m); 
if(data.empty()) throw empty stack(); 
value-data.top(); 
data.pop(); 

} 

bool empty() const 

{ 
std::lock_guard<std::mutex> lock (m); 
return data.empty(); 


这 个 栈 的 实现 实际 上 是 可 复制 的 (copyable) 源 对 象 中 的 拷贝 构造 函数 
锁定 互 斥 元 ， 然 后 复制 内 部 栈 。 你 在 构造 函数 体 中 进行 复制 @ 而 不 是 成 员 初 始 化 
列表 ， 以 确保 互 斥 元 被 整个 副本 持 有 。 


top() 和 pop() 的 讨论 表明 ， 接 口中 有 问题 的 竞争 条 件 基 本 上 因为 锁定 的 粒 
度 过 小 而 引起 。 保 护 没有 者 盖 期 望 操作 的 整体 。 互 斥 元 的 问题 也 可 以 由 锁定 的 粒 


度 过 大 而 引起 ;极端 情况 是 单个 的 全 局 互 斥 元 保护 所 有 共享 的 数据 。 在 一 个 有 大 
量 共 部 数据 的 系统 中 ， 这 可 能 会 消除 并 发 的 所 有 性 能 优势 ， 因 为 线程 被 限制 为 每 
次 只 能 运行 一 个 ， 即 便 是 在 他 们 访问 数据 的 不 同 部 分 的 时 候 。 被 设计 为 处 理 多 处 
理 器 系统 的 Linux 内 核 的 第 一 个 版 本 ， 使 用 了 单个 全 局 内 核 锁 。 虽 然 这 也 能 工作 ， 
但 却 意味 着 一 个 双 处 理 器 系统 通常 比 两 个 时 处 理 絮 系统 的 性 能 更 差 ， 四 个 处 理 器 
系统 的 性 能 远 远 没有 四 个 单 处 理 器 系统 的 性 能 好 。 有 太 多 对 内 核 的 竞争 ， 因 此 在 
更 多 处 理 器 上 运行 的 线程 无 法 进行 有 效 的 工作 。Linux 内 核 的 后 续 版 本 已 经 转移 到 
一 个 更 细 粒 度 的 锁定 方案 ， 因 而 四 个 处 理 器 的 系统 性 能 更 接近 理想 的 单 处 理 器 系 
统 的 4 倍 ， 因 为 竞争 少 得 多 。 


细 粒 度 锁 定 方案 的 一 个 问题 ， 就 是 有 时 为 了 保护 操作 中 的 所 有 数据 ， 需 要 不 
止 一 个 互 斥 元 。 如 前 所 述 ， 有 时 要 做 的 正确 的 事情 是 增加 被 互 斥 元 所 履 盖 的 数据 
粒度 ， 以 使 得 只 需要 一 个 互 斥 元 被 锁定 。 然 而 ， 这 有 时 是 不 可 取 的 ， 例 如 互 斥 元 
保护 着 一 个 类 的 各 个 实例 。 在 这 种 情况 下 ， 在 下 个 级 别 进行 锁定 ， 将 意味 着 要 么 
将 锁 丢 给 用 户 ， 要 么 就 让 单个 互 斥 元 保护 该 类 的 所 有 实例 ， 这 些 都 不 其 理想 。 


如 果 对 于 一 个 给 定 的 操作 你 最 终 需要 锁定 两 个 或 更 多 的 互 扩 元， 还 有 另 一 个 
潜在 的 问题 潜伏 在 侧 : 死 锁 〈deadlock) 。 这 几乎 是 竞争 条 件 的 反面 ， 两 个 线程 
不 是 在 竞争 成 为 第 一 ， 而 是 每 一 个 都 在 等 待 另 外 一 个 ， 因 而 都 不 会 有 任何 进展 。 


3.2.4 Ee: 问题 和 解决 方案 


试想 一 下 ， 你 有 一 个 由 两 部 分 组 成 的 玩具 ， 并 且 你 需要 两 个 部 分 一 起 玩 一 一 
fad. SUA ASHE. 现在， 假设 你 有 两 个 小 孩 ， 他 们 两 人 都 喜欢 玩 它 。 如 果 其 
中 一 人 同时 得 到 鼓 和 鼓 想 ， 那 这 个 孩子 就 可 以 高 兴 地 玩 就 ， 直 到 大 烦 。 如 果 男 一 
个 孩子 想 要 玩 ， 就 得 等 ， 不 管 这 让 他 多 不 素 。 现 在 想象 一 下 ， 鼓 和 鼓 梭 被 (分 
别 ) 埋 在 玩具 箱 里 ， 你 的 孩子 同时 都 决定 玩 它 们 ， 于 是 他 们 去 翻 玩具 箱 。 其 中 一 
个 发 现 了 鼓 ， 而 男 一 个 发 现 了 鼓 杷 。 现 在 他 们 被 困 住 了 ， 除 非 一 人 让 男 一 人 玩 ， 
T cR Edd 
所 不 成 。 


现在 想象 一 下 ， 你 没有 抢 玩 具 的 孩子 ， 但 却 有 争夺 互 斥 元 的 线程 。 一 对 线程 
中 的 每 一 个 都 需要 同时 锁定 两 个 互 斥 元 来 执行 一 些 操作 ， 并 且 每 个 线程 都 拥有 了 
一 个 互 斥 元 ， 同 时 等 竺 另外 一 个 。 线 程 都 无 法 继续 ， 因 为 每 个 线程 都 在 等 待 另 一 
个 释放 其 互 斥 元 。 这 种 情景 称 为 死 锁 (deadlock) ， 它 是 在 需要 锁定 两 个 或 更 多 
互 斥 元 以 执行 操作 时 的 最 大 问题 。 


为 了 避免 死 锁 ， 常 见 的 建议 是 始终 使 用 相同 的 顺序 锁定 这 两 个 互 斥 元 。 如 果 
你 总 是 在 互 斥 元 B 之 前 锁定 互 太 元 A， 那 么 你 永远 不 会 死 锁 。 有 时 候 这 是 很 直观 
的 ， 因 为 互 斥 元 服务 于 不 同 的 目的 ， 但 其 他 时 候 却 并 不 那么 简单 ， 比 如 当 互 斥 元 
分 别 保护 相同 类 的 各 个 实例 时 。 例 如 ， 考 虑 同一 个 类 的 两 个 实例 之 间 的 数据 交换 
操作 ， 为 了 确保 数据 被 正确 地 交换 ， 而 不 受 并 发 修改 的 影响 ， 两 个 实例 上 的 互 斥 
元 都 必须 被 锁定 。 然 而 ， 如 果 选 择 了 一 个 固定 的 顺序 例如， 作为 第 一 个 参数 所 


供 的 实例 的 互 斥 元 ， 然 后 是 作为 第 二 个 参数 所 提供 的 实力 的 互 斥 元 ) ， 可 能 适 得 
ER: 它 表示 两 个 线程 尝试 通过 交换 参数 ， 而 在 相同 的 两 个 实例 之 间 交 换 数 据 ， 
你 将 产生 死 锁 。 

幸运 的 是 ，C++ 标 准 库 中 的 std: :1ock 可 以 解雇 这 一 问题 一 std: : lock 
数 可 以 同时 锁定 两 个 或 更 多 的 互 斥 元 ， 而 没有 死 锁 的 风险 。 清 单 3.6 中 的 例子 展示 
了 如 何 使 用 它 来 完成 简单 的 交换 操作 。 


清单 3.6 在 交换 操作 中 使 用 std::lock0 和 std::lock_guard 


class some big object; 
void swap(some big object& lhs,some big object& rhs); 


class X 
{ 
private: 
some big object some detail; 
std::mutex m; 
public: 
X(some big object const& sd):some detail(sd)(] 


friend void swap(X& lhs, X& rhs) 


{ 


if (&lhs==é&rhs) 


return; 9 
std: :lock(lhs.m,rhs.m); 
Std::lock guard«std::mutex» lock a(lhs.m,std::adopt lock); < © 
Std::lock guard«std::mutex» lock_b(rhs.m,std: :adopt_lock) ; 
swap (lhs.some_detail,rhs.some_detail) ; ò 


首先 ， 检 查 参 数 以 确保 它们 是 不 同 的 实例 ， 因 为 试图 在 你 已 经 锁定 了 的 
std: :mutex 上 获取 锁 ， 是 未 定义 的 行为 。《〈 人 允许 同一 线程 多 重 锁定 的 互 斥 元 类 
型 为 std: :recursive _mutex。 详 见 3.3.3 节 ) 然后 ， 调 用 std: :lock() 锁 定 这 两 
个 互 斥 元 @， 同 时 构造 两 个 std: :lock_guard 的 实例 @ 人 全 ， 每 个 实例 对 应 一 个 互 
斥 元 。 额 外 提供 一 个 参数 std: :adopt_1lock 给 互 斥 元 ， 告 知 std: :lock_guard 
对 象 该 互 斥 元 已 被 锁定 ， 并 且 它 们 只 应 沿用 互 斥 元 上 已 有 锁 的 所 有 权 ， 而 不 是 试 
图 在 构造 函数 中 锁定 互 斥 元 。 


这 就 确保 了 通常 在 受 保护 的 操作 可 能 引发 异常 的 情况 下 ， 函 数 退 出 时 正确 地 
解锁 互 斥 元 ， 这 也 考虑 到 了 简 蛙 返回 。 此 外 ， 值 得 一 提 的 是 ， 在 对 std: :lock 的 
调用 中 锁定 1lhs .m 抑 或 是 rhs .m 都 可 能 引发 异常 ， 在 这 种 情况 下 ， 该 异常 被 传播 
出 std: :lock。 如 果 std: :lock 已 经 成 功 地 在 一 个 互 斥 元 上 获取 了 锁 ， 当 它 试 图 
在 另 一 个 互 斥 元 上 获取 锁 的 时 候 ， 就 会 引发 异常 ， 前 一 个 互 斥 元 将 会 自动 释 
放 。std: :lock 提 供 了 关于 锁定 给 定 的 互 斥 元 的 全 或 无 的 语义 。 


RE std: :lock 能 够 帮助 你 在 需要 同时 获得 两 个 或 更 多 锁 的 情况 下 避免 死 
锁 ， 但 是 如 果 要 分 别 获 取 锁 ， 就 没 用 了 。 在 这 种 情况 下 ， 你 必须 依靠 你 作为 开发 
人 员 的 戒律 ， 以 确保 不 会 得 到 死 锁 。 这 谈何容易 ， 死 锁 是 在 编写 多 线程 代码 时 过 
到 的 最 令 人 头疼 的 问题 之 一 ， 而 且 往往 无 法 预测 ， 大 部 分 时 间 内 一 切 都 工作 正 
常 。 然 而 ， 有 一 些 相 对 简单 的 规则 可 以 帮助 你 写 出 无 死 锁 的 代码 。 


3.2.5 ”避免 死 锁 的 进一步 指南 


和 死 锁 并 不 仅仅 产生 于 锁定 ， 虽 然 这 是 最 常见 的 诱因 。 你 可 以 通过 两 个 线程 来 
制造 死 锁 ， 不 用 锁定 ， 只 需 令 每 个 线程 在 std: :thread 对 象 上 为 男 一 线程 调 
用 join()。 在 这 种 情况 下 ， 两 个 线程 都 无 法 取得 进展 ， 因 为 正 等 着 刃 一 个 线程 完 
成 ， 就 像 孩子 们 争夺 他 们 的 玩具 。 这 种 简单 的 循环 可 以 发 生 在 任何 地 方 ， 一 个 线 
旦 等 待 男 一 个 线程 执行 一 些 动作 而 力 一 个 线程 同时 义 在 等 待 第 一 个 线程 ， 而 且 这 
不 仅 限 于 两 个 线程 ， 三 个 或 更 多 线程 的 循环 也 会 导致 死 锁 。 避 免 死 锁 的 准则 全 都 
可 以 归结 为 一 个 思路 ， 如 果 有 男 外 一 个 线程 有 可 能 在 等 待 你 ， 那 你 就 别 等 它 。 这 
个 独特 的 准则 为 识别 和 消除 别 的 线程 等 待 你 的 可 能 性 提供 了 方法 。 


1. HAREM 


第 一 个 思路 是 最 简单 的 ， 如 果 你 已 经 持 有 一 个 锁 ， 就 别 再 获取 锁 。 如 果 你 坚 
持 这 个 准则 ， 光 赁 使 用 锁 是 不 可 能 导致 死 锁 的 ， 因 为 每 个 线程 仅 持 有 一 个 锁 。 你 
仍然 会 从 其 他 事情 〈 像 是 线程 相互 等 待 ) 中 得 到 死 锁 ， 但 是 互 斥 元 锁定 可 能 死 锁 
最 常见 的 族 因 。 如 果 需 要 获取 多 个 锁 ， 为 了 避免 死 锁 ， 融 以 std: :1lock 的 单个 动 
作 来 实行 。 


2. 在 持 有 锁 时 ， 避 免 调用 用 户 提供 的 代码 


这 是 前 面 一 条 准则 的 简单 后 续 。 因 为 代码 是 用 户 提供 的 ， 你 不 知道 它 会 做 什 
么 ， 它 可 能 做 包括 获取 锁 在 内 的 任何 事情 。 如 果 你 在 持 有 锁 时 调用 用 户 提 供 的 代 
码 ， 并 且 这 段 代码 获取 一 个 锁 ， 你 就 违反 了 避免 幅 套 锁 的 准则 ， 可 能 导致 死 锁 。 
有 时 候 这 是 无 法 避免 的 。 如 果 你 在 编写 泛 型 代码 ， 如 3.2.3 贡 中 的 堆栈 ， 在 参数 类 
型 上 的 每 一 个 操作 都 是 用 户 提 供 的 代码 。 在 这 种 情况 下 ， 你 需要 新 的 准则 。 


3. 以 固定 顺序 获取 锁 


如 果 你 绝对 需要 获取 两 个 或 更 多 的 锁 ， 并 且 不 能 以 std: :lock 的 单个 操作 取 
得 ， 次 优 的 做 法 是 在 每 个 线程 中 以 相同 的 顺序 获取 它们 。 我 在 3.2.4 节 中 曾 谈 及 此 
点 ， 是 作为 在 获取 两 个 互 斥 元 时 避免 死 锁 的 方法 ， 关 键 是 要 以 一 种 在 线程 间 相 一 
致 的 方法 来 定义 其 顺序 。 在 某 些 情 况 下 ， 这 是 相对 简单 的 。 例 如 ， 看 一 看 3.2.3 节 
中 的 堆栈 一 一 互 斥 元 在 每 个 栈 实 例 的 内 部 ， 但 对 于 存储 在 栈 中 的 数据 项 的 操作 ， 
则 需要 调用 用 户 提供 的 代码 。 然 而 ， 你 可 以 添加 约束 ， 对 于 存储 在 栈 中 的 数据 项 
的 操作 ， 都 不 应 对 栈 本 号 进 行 任何 操作 。 这 样 就 增加 了 栈 的 使 用 者 的 负担 ， 但 是 
将 数据 存储 在 一 个 容器 中 来 访问 该 容器 是 很 罕见 的 ， 并 且 一 旦 发 生 就 会 十 分 明 


显 ， 因 此 这 并 不 是 一 个 很 难 承受 的 负担 。 


在 别 的 情况 下 ， 可 能 就 不 那么 直观 ， 就 像 在 3.2.4 节 中 你 所 看 到 的 交换 操作 那 
样 。 至 少 在 这 种 情况 下 ， 你 可 以 同时 锁定 这 些 互 斥 元 ， 但 并 不 总 是 可 能 的 。 如 果 
你 回顾 一 下 3.1 节 中 链表 的 例子 ， 你 会 看 到 一 种 保护 链表 的 可 能 性 ， 就 是 让 每 个 结 
点 都 有 一 个 互 斥 元 。 然 后 ， 为 了 访问 这 个 链表 ， 线 程 必须 获取 它们 感 兴趣 的 每 个 
结 点 上 的 锁 。 对 于 一 个 删除 茶 项 的 线程 ， 它 就 必须 获得 三 个 结 点 上 的 锁 ， 要 删除 
的 结 点 以 及 它 两 边 的 结 点 ， 因 为 它们 全 都 要 以 某 种 方式 进行 修改 。 同 样 地 ， 为 了 
遍历 链表 ， 线 程 在 获取 序列 中 下 一 个 结 点 上 的 锁 的 时 候 ， 必 须 保 持 当 前 结 点 上 的 
锁 ， 以 确保 指向 下 一 结 点 的 指针 在 此 期 间 不 被 修改 。 一 旦 获取 到 下 一 个 结 点 上 的 
锁 ， 就 可 以 释放 前 面 结 点 上 的 锁 ， 因 为 它 已 经 没 用 了 。 


这 种 逐 节 癌 上 的 锁定 方式 允许 多 线程 访问 链表 ， 前 提 是 每 个 线程 访问 不 同 的 
结 点 。 然 而 ， 为 了 避免 死 锁 ， 必 须 始终 以 相同 的 顺序 锁定 结 点 。 如 宁 两 个 线程 试 
图 用 逐 菠 锁定 的 方式 以 相反 的 顺序 遍历 链表 ， 它 们 就 会 在 链表 中 间 产 生 相 互 死 
锁 。 如 果 结 点 A 和 B 在 链表 中 相 邻 ， 一 个 方向 上 的 线程 会 试图 保持 锁定 结 点 A， 并 
尝试 获取 结 点 B 上 的 锁 。 而 另 一 个 方向 上 的 线程 会 保持 锁定 结 点 B， 并 且 淮 试 获得 
结 点 A 上 的 锁 一 一 死 锁 的 典型 情况 。 


同样 地 ， 当 删除 位 于 结 点 A 和 C 之 间 的 结 点 B 时 ， 如 果 该 线程 在 获取 结 点 A 和 C 
上 的 锁 之 前 获取 B 上 的 锁 ， 它 就 有 可 能 与 遍历 链表 的 线程 产生 死 锁 。 这 样 的 线程 
会 试图 首先 锁定 A 或 C〔( 取 决 于 遍历 的 方向 ) ， 但 是 它 接 下 来 会 发 现 无 法 获得 结 点 
人 
HC 上 的 锁 。 


在 这 里 防 正 死 锁 的 一 个 办 法 是 定义 过 历 的 顺序 ， 让 线程 必须 始终 在 锁定 B 之 
前 锁定 A、 在 锁定 C 之 前 锁定 B。 该 方法 以 禁止 反 向 吉 历 为 代价 来 消除 产生 死 锁 的 
可 能 。 对 于 其 他 数据 结构 ， 常 常会 建立 类 似 的 约定 。 


4. 使 用 锁 层次 


虽然 这 实际 上 是 定义 锁定 顺序 的 一 个 特例 ， 但 锁 层 次 能 够 提供 一 种 方法 ， 来 
检查 在 运行 时 是 否 遵循 了 约定 。 其 思路 是 将 应 用 程序 分 层 ， 并 且 确 认 所 有 能 够 在 
任意 给 定 的 层级 上 被 锁定 的 互 斥 元 。 当 代码 试图 锁定 一 个 互 斥 元 时 ， 如 果 它 在 较 
低层 已 经 持 有 锁定 ， 那 么 就 不 多 许 它 锁定 该 互 斥 元 。 通 过 给 每 一 个 互 斥 元 分 配 层 
号 ， 并 记录 下 每 个 线程 都 锁定 了 哪些 互 斥 元 ， 你 就 可 以 在 运行 时 进行 检查 了 。 清 
单 3.7 列 出 了 两 个 线程 使 用 层次 互 斥 元 的 例子 。 


清单 3.7 使 用 锁 层次 来 避免 死 锁 


hierarchical mutex high level mutex(10000); E 1) 
hierarchical mutex low level mutex(5000); «e 


int do low level stuff(); 


int low level func(í) 


{ 


Std::lock guard«hierarchical mutex> 1k(low_level mutex) ; + @ 
return do low level stuff(); 


} 


void high level stuff(int some param); 


void high level func() 


{ 


std::lock guard«hierarchical mutex» lk(high level mutex) ; «—D 
high level stuff(low level func()); 

EP 

void thread a() 0O 


{ 
} 


hierarchical mutex other_mutex (100) ; 9 
void do other stuff(); 


high level func(); 


void other stuff() 


{ 
high level func(); <O 
do other stuff(); 


} 


void thread_b() -© 

{ 
Std::lock guard<hierarchical mutex» lk(other mutex); <M) 
other stuff(); 


thread_a( )@ 遵 守 了 规则 ， 所 以 它 运行 良好 。 男 一 方面 ，thread_b() 人 无 
视 了 规则 ， 因 此 将 在 运行 时 失败 。thread_a( ) 调 用 high_level func(), fit 
定 了 high_level_mutex@ (具有 层次 值 10000@) 并 接着 使 用 这 个 锁定 了 的 互 斥 
元 调用 low_level func() 回 ， 以 获得 high_level_stuff() 的 参 
Zi. low level func()HE 8E [low level mutex&). BÆRXR, AWZ 
Heo HAS BURA 1450008. 


在 另 一 方面 thread_b() 却 不 受 。 刚 开始 ， 它 锁定 了 other_mutex 人 多 ， 它 具 
有 的 层次 值 仅 为 100@。 这 意味 着 它 应 该 是 保护 着 超 低 级 别 的 数据 。 
当 other_stuff() 调 用 high_level func() 合 时， 就 会 违反 层 


次 。high_level_func() 试 图 获取 值 为 10000 的 high_level_mutex， 大 大 超过 
100 的 当前 层次 值 。 因 此 ，hierarchical_mutex 可 能 通过 引发 异常 或 终止 程序 来 
报错 。 层 次 互 斥 元 之 间 的 死 锁 是 不 可 能 出 现 的 ， 因 为 互 斥 元 本 身 实行 了 锁定 顺 
序 。 这 还 意味 着 如 果 两 个 锁 在 层次 中 处 于 相同 级 别 ， 你 就 不 能 同时 持 有 它们 ， 
此 逐 节 锁定 的 方案 要 求 链 条 中 的 每 个 互 斥 元 具有 比 前 一 个 互 斥 元 更 低 的 层次 值 ， 
在 某 些 情况 下 这 可 能 是 不 切实 际 的 。 


这 个 例子 也 展现 了 另外 一 点 ， 带 有 用 户 定 义 的 互 斥 元 类 型 的 
std: :lock_guard<> 模 板 的 使 用 。hierarchical_mutex 不 是 标准 的 一 部 分 ， 但 
易于 编写 。 清 单 3.8 中 展示 了 一 个 简单 的 实现 。 即 便 它 是 个 用 户 定义 的 类 型 ， 但 是 
可 以 用 于 std: :lock_guard<>， 这 是 因为 它 实现 了 满足 互 斥 元 概念 所 需要 的 三 个 
成 员 函 数 : lock()、unlock() 和 try_lock()。 你 还 没有 见 过 直接 使 
用 try_1lock()， 但 它 是 相当 简单 的 。 如 果 互 斥 元 上 的 锁 已 被 另 一 个 线程 持 有 ， 
则 返回 false， 而 非 一 直 等 到 调用 线程 可 以 获取 该 互 斥 元 上 的 锁 。try_1lock() 也 
可 以 在 std: :lock() 内 部 ， 作 为 避免 死 锁 算法 的 一 部 分 来 使 用 。 


清单 3.8 简单 的 分 层次 互 斥 元 


class hierarchical mutex 


{ 


std::mutex internal mutex; 

unsigned long const hierarchy_value; 

unsigned long previous hierarchy value; 

static thread local unsigned long this thread hierarchy value; -+ 


void check for hierarchy violation() 


{ 


if(this thread hierarchy value <= hierarchy value) 9 


{ 
} 


throw std::logic error("mutex hierarchy violated"); 


} 

void update_hierarchy_value() 

{ 
previous_hierarchy_value=this_thread_hierarchy_value; 9 
this thread hierarchy value-hierarchy value; 

j 

public: 

explicit hierarchical mutex(unsigned long value): 
hierarchy value(value), 
previous hierarchy value(0) 


Ü 


void lock() 


{ 


check for hierarchy violation () ; 
internal mutex.lock(); 0 
update hierarchy value (); «9 


} 


void unlock () 


{ 
this thread hierarchy value-previous hierarchy value; 0O 
internal mutex.unlock(); 


) 


bool try lock() 


{ 
check for hierarchy violation () ; 
if(!internal mutex.try lock()) 0 
return false; 
update hierarchy value(); 
return true; 


} 
}; 
thread local unsigned long 
hierarchical mutex::this thread hierarchy value (ULONG MAX); S 


这 里 的 关键 是 使 用 thread_local 的 值 来 表示 当前 线程 的 层次 
值 : this_thread_hierarchy_value@, 它 被 初始 化 为 最 大 值 @， 所 以 在 刚 开 
始 的 时 候 任意 互 斥 元 都 可 以 被 锁定 。 由 于 它 被 声明 为 thread_local， 每 个 线程 
都 有 属于 自己 的 副本 ， 所 以 在 一 个 线程 中 该 变量 的 状态 ， 完 全 独立 于 从 另 一 个 线 
参阅 附录 A，A.8 节 可 以 获得 关于 thread local 的 更 多 


因此 ， 当 线程 第 一 次 锁定 hierarchical_mutex 的 实例 
If, this thread hierarchy value 的 值 为 ULONG_MAX。 就 其 本 质 而 
言 ，ULONG_MAX 比 其 他 任意 值 都 大 ， 所 以 通过 了 
check_for_hierarchy_violation() 人 中 的 检查 。 在 检查 通过 之 后 ，1lock() 代 
理 内 部 的 互 斥 元 用 以 实际 锁定 人 @。 一 旦 该 锁定 成 功 ， 就 可 以 更 新 层次 值 @。 


现在 如 果 在 持 有 第 一 个 hierarchical_mutex 上 的 锁 的 同时 ， 锁 定 另 一 
个 hierarchical _mutex， 则 this_thread_hierarchy_value 的 值 反 映 的 是 第 
一 个 互 斥 元 的 层次 值 。 为 了 通过 检查 信 ， 第 二 个 互 斥 元 的 层次 值 必须 小 于 已 经 持 
有 的 互 斥 元 的 层次 值 。 


现在 ， 保 存 当 前 线程 之 前 的 层次 值 是 很 重要 的 ， 这 样 才 能 在 unlock() 中 恢复 
EG; 否则 ， 你 就 无 法 再 次 锁定 一 个 具有 更 高 层次 值 的 互 斥 元 ， 即 便 该 线程 并 没 
有 持 有 任何 锁 。 因 为 只 有 当 你 持 有 internal_mutex 时 才能 保存 之 前 的 层次 值 
僵 ， 并 在 解锁 该 内 部 互 斥 元 之 前 释放 它 @， 你 可 以 安全 地 将 其 存储 


在 hierarchical_mutex 自 身 中 ， 因 为 它 被 内 部 互 斥 元 上 的 锁 安全 地 保护 。 


try_lock() 和 1lock() 工 作 原 理 相 同 ， 只 是 ， 如 果 在 internal_mutex 上 调 
用 try_lock() 失 败 @， 那 么 你 就 无 法 拥有 这 个 锁 ， 所 以 不 能 更 新 层次 值 ， 并 且 
返回 false 而 不 是 true。 


虽然 检测 是 在 运行 时 间 检 查 ， 但 它 至 少 不 依 赖 于 时 间 一 一 你 不 必 去 等 待 能 够 
导致 死 锁 出 现 的 罕见 情况 发 生 。 此 外 ， 需 要 以 这 种 方式 划分 应 用 程序 和 互 斥 元 的 
设计 流程 ， 可 以 在 写 入 代码 之 前 帮助 消除 许多 可 能 导致 死 锁 的 原因 。 即 使 你 还 没 
有 到 达 实 际 编写 运行 时 间 检 测 的 那 一 步 ， 进 行 设计 练习 仍然 是 值得 的 。 


5. 将 这 些 设计 准则 扩展 到 锁 之 外 


正如 我 在 本 节 开 始 时 提 到 的 ， 死 锁 不 只 是 出 现 于 锁定 中 ， 它 可 以 发 生 在 任何 
可 以 导致 循环 等 待 的 同步 结构 中 。 因 此 ， 扩 展 上 面 所 述 的 准则 来 涵盖 那些 情况 也 
是 值得 的 。 举 个 例子 ， 正 如 你 应 该 尽量 避免 获取 髓 套 锁 那样 ， 在 持 有 锁 时 等 待 
个 线程 是 坏 主意 ， 因 为 该 线程 可 能 需要 获取 这 个 锁 以 继续 运行 。 类 似 地 ， 如 果 你 
正 要 等 待 一 个 线程 完成 ， 指 定 线程 层次 结构 可 能 也 是 值得 的 ， 这 样 线程 就 只 需要 
等 待 低层 次 上 的 线程 。 一 个 简单 的 做 到 这 一 点 的 方法 ， 就 是 确保 你 的 线程 在 局 动 
它们 的 同一 个 函数 中 被 结合 ， 惑 像 3.1.2 节 和 3.3 节 中 所 描述 的 那样 。 


一 旦 你 设计 了 代码 来 避免 死 锁 ，std: :lock() 和 std: :1ock_guard 涵 盖 了 大 
多 数 简单 锁定 的 情况 ， 但 有 时 却 需要 更 大 的 灵活 性 。 在 那 种 情况 下 ， 标 准 库 提 供 
了 std: :unique lock 模板。 与 std: :lock_guard 类 似 ，std: :unique_lock 是 
在 互 斥 元 类 型 上 进行 参数 化 的 类 模板 ， 并 且 它 也 提供 了 与 std: :1ock_guard 相 同 
的 RAII 风 格 锁 管 理 ， 但 是 更 加 灵活 。 


3.2.6 JHistd::unique lock X 7/5 8 4E 


通过 松弛 不 变量 ，std: :unique_lock 比 std: :lock_guard 提 供 了 更 多 的 灵 
活性 ， 一 个 std: :unique_lock 实 例 并 不 总 是 拥有 与 之 相关 联 的 互 斥 元 。 首 先 ， 
就 像 你 可 以 把 std: :adopt_lock 作 为 第 二 参数 传递 给 构造 函数 ， 以 便 让 锁 对 象 来 
管理 互 斥 元 上 的 锁 那 样 ， 你 也 可 以 把 std: :defer_lock 作 为 第 二 参数 传递 ， 来 表 
示 该 互 斥 元 在 构造 时 应 保持 未 被 锁定 。 这 个 锁 就 可 以 在 这 之 后 通过 
在 std: :unique_lock 对 象 〈 不 是 互 斥 元 ) 上 调用 lock()， 或 是 通过 
将 std: :unique_lock 对 象 本 有 身 传递 给 std: :lock( ) 来 获取 。 使 
用 std: :unique_lock 和 std::defer_lock@， 而 不 是 std: :lock_guard 和 
std: :adopt_lock， 能 够 很 容易 地 将 清单 3.6 写 成 清单 3.9 中 所 示 的 那样 。 这 段 代 
码 具 有 相同 的 行 数 ， 并 且 本 质 上 是 等 效 的， 除了 一 个 小 问 
题 ，std: :unique_lock 占 用 更 多 空间 并 且 使 用 起 来 比 std: :1ock_guard 略 慢 。 
允许 std: :unique_lock 实 例 不 拥有 互 斥 元 的 灵活 性 是 有 代价 的 ， 这 条 信息 必须 
被 存储 ， 并 且 必 须 被 更 新 。 


清单 3.9 在 交换 操作 中 使 用 std::lock0 和 std::unique_lock 


class some_big object; 
void swap(some big object& lhs,some big object& rhs); 
class X 
private: 
some big object some detail; 
std::mutex m; 
public: 


X(some big object const& sd):some detail(sd)() 


std-:defer lock (REIS. 0 
"ini void swap(X& lhs, X& rhs) 元 为 未 锁定 

if (&lhs==&rhs) 

return; 

std::unique lock«std::mutex» lock a(lhs.m,std::defer lock); 

std: :unique lock«std::mutex» lock b(rhs.m,std::defer lock); 

std::lock(lock a,lock b) 

zap (lhs. detail, rhs.so detail); 

swap (lhs.some_detail,rhs.some_detai 互 斥 元 在 这 里 

被 锁定 


在 清单 3.9 中 ，std: :unique_lock 对 象 能 够 被 传递 给 std: :lock()@, AW 
为 std: :unique lock 提供 了 lock()、try_lock() 和 unlock() 三 个 成 员 函 数 。 
它们 会 转发 给 底层 互 斥 元 上 同名 的 成 员 函 数 去 做 实际 的 工作 ， 并 且 只 是 更 新 
在 std: :unique_lock 实 例 内 部 的 一 个 标识 ， 来 表示 该 实例 当前 是 否 拥有 此 互 斥 
元 。 为 了 确保 unlock() 在 析 构 函数 中 被 正确 调用 ， 这 个 标识 是 必需 的 。 如 果 该 实 
例 确 已 拥有 此 互 斥 元 ， 则 析 构 函数 必须 调用 unlock( )， 并 且 ， 如 果 该 实例 并 未 
拥有 此 互 斥 元 ， 则 析 构 函数 绝 不 能 调用 unlock() 。 可 以 通过 调用 owns_1lock() 
成 员 函 数 来 查询 这 个 标识 。 


如 你 所 想 ， 这 个 标识 必须 被 存储 在 某 个 地 方 。 因 此 ，std: :unique_lock 对 
象 的 大 小 通 MAF std: :lock_guard 对 象 ， 并 且 相 比 于 std: :1lock_guard， 使 
用 std: :unique_lock 的 时 候 ， 会 有 些许 性 能 损失 ， 因 为 需要 对 标识 进行 相应 的 
更 新 或 检查 。 如 果 std: :lock_guard 足 以 满足 需求 ， 我 会 建议 优先 使 用 它 。 也 就 
是 说 ， 还 有 一 些 使 用 std: :unique_1lock 更 适合 于 手头 任务 的 情况 ， 因 为 你 需要 
利用 额外 的 灵活 性 。 一 个 例子 就 是 延迟 锁定 ， 正 如 你 已 经 看 到 的 ; 另 一 种 情况 是 
锁 的 所 有 权 需 要 从 一 个 作用 域 转移 到 另 一 个 作用 域 。 


3.2.7. ”在 作用 域 之 间 转 移 锁 的 所 有 权 


因为 std: :unique_1Lock 实 例 并 没有 拥有 与 其 相关 的 互 斥 元 ， 所 以 通过 四 处 
移动 (moving) 实例 ， 互 斥 元 的 所 有 权 可 以 在 实例 之 间 进 行 转移 。 在 茶 些 情况 下 
这 种 转移 是 自动 的 ， 比 如 从 函数 中 返回 一 个 实例 ， 而 在 其 他 情况 下 ， 你 必须 通过 
调用 std: :move() 来 显 式 实现 。 从 根本 上 说 ， 这 取决 于 源 是 否 为 左 值 《lvalue) 

变量 或 对 实 变量 的 引用 或 者 是 右 值 (rvalue) 一 一 某 种 临时 量 。 如 果 
源 为 右 值 ， 则 所 有 权 转 移 是 自动 的 ， 而 对 于 左 值 ， 所 有 权 转 移 必须 显 式 地 完成 ， 


以 避免 从 变量 中 意外 地 转移 了 所 有 权 。std::unique_lock 就 是 可 移动 (movable) 但 
不 可 复制 Ccopyable) 的 类 型 的 例子 。 关 于 移动 语义 的 详情 ， 可 参阅 附录 A 中 
A.1.1 节 。 


一 种 可 能 的 用 法 ， 是 允许 函数 锁定 一 个 互 太 元 ， 并 将 此 锁 的 所 有 权 转 移 给 调 
用 者 ， 于 是 调用 者 接 下 来 可 以 在 同一 个 锁 的 保护 下 执行 额外 的 操作 。 下 面 的 代码 
片段 展示 了 这 样 的 例子 :函数 get_lock() 锁 定 了 互 斥 元 ， 然 后 在 将 锁 返 回 给 调 
用 者 之 前 准备 数据 。 


std: :unique lock<std::mutex> get lock() 


{ 
extern std::mutex some mutex; 
std::unique lock«std::mutex» lk(some_mutex) ; 
prepare data(); 
return 1k; 0 

} 

void process data() 

{ 
std::unique lock«std::mutex» lk(get_lock()}); -© 
do somethingí); 

j 


因为 lk 是 在 函数 内 声明 的 自动 变量 ， 它 可 以 被 直接 返回 @ 而 无 需 调用 
std: : move(); 编译 器 负责 调用 移动 构造 函数 。process_data( ) 函 数 可 以 直 
接 将 所 有 权 转 移 到 它 自己 的 std: :unique_lock 实 例 @， 并 且 对 
do_something() 的 调用 能 够 依赖 被 正确 准备 了 的 数据 ， 而 无 需 另 一 个 线程 在 此 
期 间 去 修改 数据 。 


通常 使 用 这 种 模式 ， 是 在 待 锁定 的 互 斥 元 依赖 于 程序 的 当前 状态 ， 或 者 依赖 
于 传递 给 返回 std: :unique_lock 对 象 的 函数 的 参数 的 地 方 。 这 种 用 法 之 一 ， 就 
是 并 不 直接 返回 锁 ， 但 是 使 用 一 个 网 关 类 的 数据 成 员 ， 以 确保 正确 锁定 了 对 受 保 
护 的 数据 的 访问 。 这 种 情况 下 ， 所 有 对 该 数据 的 访问 都 通过 这 个 网 关 类 ， 当 你 想 
要 访问 数据 时 ， 就 获取 这 个 网 关 类 的 实例 〈 通 过 调用 类 似 于 前 面 例子 中 的 
get_lock() 函 数 ) ， 它 会 获取 锁 。 然 后 ， 你 可 以 通过 网 天 对 象 的 成 员 函 数 来 访 
问 数据 。 在 完成 后 ， 销 毁 网 关 对 象 ， 从 而 释放 锁 ， 并 人 允许 其 他 线程 访问 受 保护 的 
数据 。 这 样 的 网 关 对 象 很 可 能 是 可 移动 的 〈 因 此 它 可 以 从 函数 返回 ) ， 在 这 种 情 
况 下 ， 锁 对 象 的 数据 成 员 也 需要 是 可 移动 的 。 


std: :unique_lock 的 灵活 性 同样 允许 实例 在 被 销毁 之 前 撤回 它们 的 锁 。 你 
可 以 使 用 unlock() 成 员 函 数 来 实现 ， 就 像 对 于 互 斥 元 那样 ，std: :unique_lock 
支持 与 互 斥 元 一 样 的 用 来 锁定 和 解锁 的 基本 成 员 函 数 集合 ， 这 是 为 了 让 它 可 以 用 
于 通用 函数 ， 比 如 std: :lock。 在 std: :unique_lock 实 例 被 销毁 之 前 释放 锁 的 


能 力 ， 意 味 着 你 可 以 有 选择 地 在 特定 的 代码 分 支 释 放 锁 ， 如 果 很 显然 不 再 需要 这 
个 锁 ， 这 对 于 应 用 程序 的 性 能 可 能 很 重要 。 持 有 锁 的 时 间 比 所 需 时 间 更 长 ， 会 导 
致 性 能 下 降 ， 因 为 其 他 等 竺 该 锁 的 线程 ， 被 阻止 运行 超过 了 所 需 的 时 间 。 


3.2.8 ”锁定 在 恰当 的 粒度 


描述 由 单个 锁 所 保护 的 数据 量 。 细 粒度 锁 保 护 着 少量 的 数据 ， 粗 粒度 锁 保护 着 的 
大 量 的 数据 。 选 择 一 个 足够 粗 的 锁 粒 度 ， 来 确保 所 需 的 数据 都 被 保护 是 很 重要 
的 ， 不 仅 如 此 ， 同 样 重要 的 十， 确保 只 在 真正 需要 锁 的 操作 中 持 有 锁 。 我 们 都 知 
道 ， 带 肴 满 满 一 车 杂货 在 超市 排队 结账 ， 只 因为 正在 结账 的 人 突然 意识 到 自己 瑟 
了 一 些小 红 春 着 ， 然 后 就 跑 去 找 ， 而 让 大 家 都 等 痢 ， 或 者 收银 员 已 经 准备 好 收 
钱 ， 顾 客 才 开始 在 自己 的 手提 包 里 翻 找 钱包 ， 是 很 令 人 抓 狂 的 。 如 果 每 个 人 去 结 
账 时 都 拿 到 了 他 们 想 要 的 ， 并 准备 好 了 适当 的 支付 方式 ， 一 切 都 更 容易 进行 。 


这 同样 适用 于 线程 ， 如 果 多 个 线程 正 等 待 着 同一 个 资源 (收银 台 的 收银 
员 ) ， 然 后 ， 如 果 任 意 线程 持 有 锁 的 时 间 比 所 需 时 间 长 ， 就 会 增加 等 待 所 花费 的 
总 时 间 (不 要 等 到 你 已 经 到 了 收银 台 才 开 始 寻找 小 红 莓 着) 。 如 果 可 能 ， 仅 在 实 
际 访问 共享 数据 的 时 候 锁定 互 斥 元 ， 誉 试 在 锁 的 外 面 做 任意 的 数据 处 理 。 特 别 
地 ， 在 持 有 锁 时 ， 不 要 做 任何 确实 很 耗 时 的 活动 ， 比 如 文件 DO。 文件 IO 通常 比 
从 内 存 中 读 取 或 写 入 相同 大 小 的 数据 量 要 慢 上 数 百倍 〈 如 果 不 是 数 干 倍 ) 。 因 
此 ， 除 非 这 个 锁 是 真 的 想 保护 对 文件 的 访问 ， 否 则 在 持 有 锁 时 进行 1O 会 不 必要 地 
延 汉 其 他 线程 因为 它们 在 和 入 次 取 倘 时 会 明 守 》， 江 在 地 消除 了 合用 多 线 各 内 
来 的 性 能 提升 。 


std: :unique_lock 在 这 种 情况 下 运作 良好 ， 因 为 能 够 在 代码 不 再 需要 访问 
共享 数据 时 调用 unlock()， 然 后 在 代码 中 叉 需 要 访问 时 再 次 调用 lock()。 


void get and process data{) 
|j std::unique lock<std::mutex> my lock(the mutex); 在 对 process0 的 调用 中 
some_class data to process-get next data chunk D 不 需要 锁定 互 斥 元 
my lock.unlock(í); 
result type result=process (data to process); 
my lock.lock(í); 4 
write result (data to process,result); 


重新 锁定 互 斥 元 以 同 写 
@ .- 


在 调用 process() 过 程 中 不 需要 锁定 互 斥 元 ， 所 以 手动 地 将 其 在 调用 前 解锁 
@， 并 在 之 后 再 次 锁定 人 @。 


硕 望 这 是 显而易见 的 ， 如 果 你 让 一 个 互 斥 锁 保 护 整 个 数据 结构 ， 不 仅 可 能 会 
有 更 多 的 对 锁 的 竞争 ， 锁 被 持 有 的 时 间 也 可 能 会 减少 。 更 多 的 操作 步骤 会 需要 在 
司 一 个 互 斥 元 上 的 锁 ， 所 以 锁 必 须 被 持 有 更 长 的 时 间 。 这 种 成 本 上 的 双重 打击 ， 
也 是 尽 可 能 走向 细 粒 度 锁 定 的 双重 激励 。 


如 这 个 例子 所 示 ， 锁 定 在 恰当 的 粒度 不 仅 关 乎 锁定 的 数据 量 ， 这 也 是 关系 到 
锁 会 被 持 有 多 长 时 间 ， 以 及 在 持 有 锁 时 执行 哪些 操作 。 一 般 情 况 下 ， 只 应 该 以 执 
行 要 求 的 操作 所 需 的 最 小 可 能 时 间 而 去 持 有 锁 。 这 也 意味 着 耗 时 的 操作 ， 比 如 获 
取 必 一 个 锁 《〈 即 便 你 知道 它 不 会 死 锁 ) 或 是 等 待 TO 完 成 ， 都 不 应 该 在 持 有 锁 的 时 
候 去 做 ， 除 非 绝 对 必要 。 


在 清单 3.6 和 清单 3.9 中 ， 需 要 锁定 两 个 互 斥 锁 的 操作 是 交换 操作 ， 这 显然 需 
要 并 发 访问 两 个 对 象 。 假 设 取 而 代 之 ， 你 试图 去 比较 仅 为 普通 int 的 简单 数据 成 
Ro KAA KAS? int 可 以 轻易 被 复制 ， 所 以 你 可 以 很 容易 地 为 每 个 待 比较 的 
的 对 象 复 制 其 数据 ， 同 时 只 用 持 有 该 对 象 的 锁 ， 然 后 比较 已 复制 数值 。 这 意味 着 
你 在 每 个 互 斥 元 上 持 有 锁 的 时 间 最 短 ， 并 且 你 也 没有 在 持 有 一 个 锁 的 时 候 去 锁定 
另外 一 个 。 清 单 3.10 展 示 了 这 样 的 一 个 类 Y， 以 及 相等 比较 运算 符 的 示例 实现 。 


清单 3.10 在 比较 运算 符 中 每 次 锁定 一 个 互 斥 元 


class Y 

private: 
int some detail; 
mutable std::mutex m; 


int get detail(í() const 
std::lock guard«std::mutex» lock aí(m); 0 
return some_detail; 
} 
public: 


Y{int sd) :some detail (sd) {} 


friend bool operator--(Y const& lhs, Y const& rhs) 


{ 
if (&lhs==&rhs} 
return trus; 
int const lhs_value=lhs.get_detail(); +9 
int const rhs value=rhs.get detail (); «9 
return lhs value==rhs value; +Q 
} 


在 这 种 情况 下 ， 比 较 运 算 符 首 先 通过 调用 get_detail() 成 员 函 数 获取 要 进 
行 比较 的 值 @@、 合 。 此 函数 在 获取 值 的 同时 用 一 个 锁 来 保护 它 @。 比 较 运算 符 接 
着 比较 获取 到 的 值 @@。 但 是 请 注意 ， 这 同样 会 减少 锁定 的 时 间 ， 而 且 每 次 只 持 有 
一 个 锁 (从 而 消除 了 死 锁 的 可 能 性 ) ， 与 同时 持 有 两 个 锁 相 比 ， 这 巧妙 地 改变 了 


操作 的 语义 。 在 清单 3.10 中 ， 如 果 运 算 符 返回 true， 意 味 着 1hs .some_detail 在 
一 个 时 间 点 的 值 与 rhs.some_detail1 在 另 一 个 时 间 点 的 值 相等 。 这 两 个 值 能 够 在 
两 次 读 取 之 中 以 任何 方式 改变 。 例 如 ， 这 两 个 值 可 能 在 @ 和 人 @ 之 间 进 行 了 交换 ， 
从 而 使 这 个 比较 变 得 毫 无 意义 。 这 个 相等 比较 可 能 会 返回 true 来 表示 值 是 相等 
的 ， 即 使 这 两 个 值 在 某 个 瞬间 从 未 真正 地 相等 过 。 因 此 ， 当 进行 这 样 的 改变 时 小 
心 注 意 是 很 重要 的 ， 操 作 的 语义 不 能 以 有 问题 的 方式 而 被 改变 : 如 果 你 不 能 在 操 
作 的 整个 持续 时 间 中 持 有 所 需 的 锁 ， 你 就 把 自己 暴露 在 竞争 条 件 中 。 


有 时 ， 根 本 就 没有 一 个 合适 的 粒度 级 别 ， 因 为 并 非 所 有 的 对 数据 结构 的 访问 
都 要 求 同 样 级 别 的 保护 。 在 这 种 情况 下 ， 使 用 蔡 代 机 制 来 代替 普通 的 
std: :mutex 可 能 才 是 恰当 的 。 


3.3 ”用 于 共 圣 数据 你 护 的 葵 代 工具 


虽然 互 斥 元 是 最 通用 的 机 制 ， 但 提 到 保护 共享 数据 时 ， 它 们 并 不 是 唯一 的 选 
f 还 有 别 的 蔡 代 品 ， 可 以 在 特定 情况 下 提供 更 恰当 的 保护 。 


一 个 特别 极端 (但 却 相当 常见 ) 的 情况 ， 就 是 共享 数据 只 在 初始 化 时 才 和 需要 
并 发 访问 的 保护 ， 但 在 那 之 后 却 不 需要 显 式 同步 。 这 可 能 是 因为 数据 是 一 经 创建 
就 是 只 读 的 ， 所 以 就 不 存在 可 能 的 同步 问题 ， 或 者 是 因为 必要 的 保护 作为 数据 上 
操作 的 一 部 分 被 隐 式 地 执行 。 在 任 一 情况 中 ， 在 数据 被 初始 化 之 后 锁定 互 斥 元 ， 
纯粹 是 为 了 保护 初始 化 ， 这 是 不 必要 的 ， 并 且 对 性 能 会 产生 的 不 必要 的 打击 。 为 
人 


3.3.1 在 初始 化 时 保护 共享 数据 


假设 你 有 一 个 构造 起 来 非常 昂贵 的 共享 资源 ， 只 有 当 实 际 需要 时 你 才 会 要 这 
样 做 。 也 许 ， 它 会 打开 一 个 数据 库 连 接 或 分 配 大 量 的 内 存 。 像 这 样 的 延迟 初始 化 
(lazyinitialization) 在 单线 程 代码 中 是 很 常见 的 一 一 每 个 请 求 资 源 的 操作 首先 检 
查 它 是 否 已 经 初始 化 ， 如 果 没 有 器 在 使 用 之 前 初始 化 之 。 
std::shared ptr«some resource> resource ptr; 
void foo() 


{ 


if (!resource ptr) 


{ 


resource ptr.reset (new some resource); +@ 
} 
resource ptr-»do something(); 
} 

如 果 共 享 资源 本 身 对 于 并 发 访问 是 安全 的 ， 当 将 其 转换 为 多 线程 代码 时 唯一 
需要 保护 的 部 分 就 是 初始 化 @， 但 是 像 清 单 3.11 中 这 样 的 朴素 的 转换 ， 会 引起 使 
用 该 资源 的 线程 产生 不 必要 的 序列 化 。 这 是 因为 每 个 线程 都 必须 等 待 互 斥 元 ， 以 
检查 资源 是 否 已 经 被 初始 化 。 


清单 3.11 使 用 互 斥 元 进行 线程 安全 的 延迟 初始 化 


std::shared ptr«some resource» resource ptr; 
std::mutex resource mutex; 
void foo() 


所 有 的 线程 在 这 里 被 序 
std: :unique_lock<std::mutex> lk(resource mutex); «— 列 化 
if (!resource_ptr) 
{ 
resource _ptr.reset (new some resource); < 只 有 初始 化 需要 
) "ER H Hom Ss 
被 保护 


lk.unlock(); 
resource ptr-»do something(); 


这 段 代 码 是 很 常见 的 ， 不 必要 的 序列 化 问题 已 足够 大 ， 以 至 于 许多 人 都 试图 
想 出 一 个 更 好 的 方法 来 实现 ， 包 括 具 名 昭著 的 二 次 检查 锁定 Double- 
CheckedLocking) 模式 ， 在 不 获取 锁 @ 在 下 面 的 代码 中 ) 的 情况 下 首次 读 取 指 
针 ， 并 仅 当 此 指针 为 NULL 时 获得 该 锁 。 一 旦 已 经 获取 了 锁 ， 该 指针 要 被 再 次 检查 
O 〈 这 就 是 二 次 检查 的 部 分 ) ， 以 防止 在 首次 检查 和 这 个 线程 获取 锁 之 间 ， 另 一 
个 线程 就 已 经 完成 了 初始 化 。 


void undefined behaviour with double checked locking() 


{ 
if (!resource ptr) 0 
{ 
std: :lock_guard<std: :mutex> lk(resource mutex); 
if (!resource ptr) +@ 
{ 
resource ptr.reset (new some resource); x 
) 
resource ptr-»do something(); 0O 
} 


AEN Es AIRERA NEAR AA Ho EA HY HEP ES S B) Y PR 
件 ， 因 为 在 锁 外 部 的 读 取 @ 与 锁 内 部 由 男 一 线程 完成 的 写 入 不 同步 @。 这 就 因此 
创建 了 一 个 竞争 条 件 ， 不 仪 涵盖 了 指针 本 里， 还 涵盖 了 指向 的 对 象 。 束 算 一 个 线 
程 看 到 男 一 个 线程 写 入 的 指针 ， 它 也 可 能 无 法 看 到 新 创建 的 some_resource 实 
例 ， 从 而 导致 do_something( )@ 的 调用 在 不 正确 的 值 上 运行 。 这 是 一 个 竞争 条 
件 的 例子 ， 该 类 型 的 竞争 条 件 被 C++ 标准 定义 为 数据 竞争 〈datarace) ， 因 此 被 
定 为 未 定义 行为 。 因 此 ， 这 是 肯定 需要 避免 的 。 内 存 模型 的 详细 讨论 参见 第 5 
章 ， 包 括 了 什么 构成 数据 竞争 。 


C++ 标准 委员 会 也 发 现 这 是 一 个 重要 的 场景 ， 所 以 C++ 标准 库 提 供 了 
std: :once flag 和 std: :cal1l_once 来 处 理 这 种 情况 。 与 其 锁定 互 斥 元 并 且 显 式 
地 检查 指针 ， 还 不 如 每 个 线程 都 可 以 使 用 std: :cal1_once， 到 std: :call_once 
返回 时 ， 指 针 将 会 被 某 个 线程 初始 化 〈 以 完全 同步 的 方式 ) ， 这 样 就 安全 了 。 使 


用 std: :call_once 比 显 式 使 用 互 斥 元 通常 会 有 更 低 的 开销 ， 特 别 是 初始 化 已 经 

完成 的 时 候 ， 所 以 在 std: :call_once 符 合 所 要 求 的 功能 时 应 优先 使 用 之 。 下 面 

的 例子 展示 了 与 清单 3.11 相 同 的 操作 ， 改 写 为 使 用 std: :call_once。 在 这 种 情况 
下 ， 通 过 调用 前 数 来 完成 初始 化 ， 但 是 通过 一 个 带 有 前 数 调用 操作 符 的 类 实例 也 
可 以 很 容易 地 完成 初始 化 。 与 标准 库 中 接受 函数 或 者 断言 作为 参数 的 大 部 分 函数 
类 似 ，std: :call_once 可 以 与 任意 函数 或 可 调用 对 象 合 作 。 


std: :shared ptr«some resource> resource ptr; 
std: :once flag resource flag; 4 


void init resource () 


void foo() 


初始 化 会 被 正好 
,| 调用 一 次 


resource_ptr.reset (new some resource); 


std::call_once(resource_ flag,init resource); 
resource ptr-»do something(); 


) 


在 这 个 例子 中 ，std: :once_flag@ 和 被 初始 化 的 数据 都 是 命名 空间 作用 域 
的 对 象 ， 但 是 std: :call_once() 可 以 容易 地 用 于 类 成 员 的 延迟 初始 化 ， 如 清单 
3.12 所 示 。 


清单 3.12 ”使 用 std::call_once 的 线程 安全 的 类 成 员 延 迟 初 始 化 


class X 


{ 


private: 
connection_info connection details; 
connection_handle connection; 
std::once flag connection init flag; 


void open connection() 


{ 
} 


publie: 


connection-connection manager.open(connection details); 


X(connection info const& connection details ): 
connection details(connection details ) 


void send dataí(data packet const& data) 0 


Std::call once(connection init flag,&X::open connection,this); 
connection.send data (data); 


} 


data packet receive data (} <O 


std::call_once (connection init flag,&X::open connection,this); 
return connection.receive data(); 


} 


在 这 个 例子 中 ， 初 始 化 由 首次 调用 send_data( )@ 或 是 由 首次 调 
用 receive_data( ) 全 来 完成 。 使 用 成 员 函 数 open_connection( ) 来 初始 化 数 
据 ， 同 样 需要 将 this 指 针 传 入 函数 。 和 标准 库 中 其 他 接受 可 调用 对 象 的 函数 一 
样 ， 比 如 std: :thread 和 std: :bind() 的 构造 函数 ， 这 是 通过 传递 一 个 额外 的 参 
数 给 std: :call_once() 来 完成 的 @。 


值得 注意 的 是 ， 像 std: :mutex、std: :once_flag 的 实例 是 不 能 被 复制 或 移 
动 的 ， 所 以 如 果 想 要 像 这 样 把 它们 作为 类 成 员 来 使 用 ， 就 必须 显 式 定义 这 些 你 所 
需要 的 特殊 成 员 函 数 。 


一 个 在 初始 化 过 程 中 可 能 会 有 竞争 条 件 的 场景 ， 是 将 局 部 变量 声明 为 static 
的 。 这 种 变量 的 初始 化 ， 被 定义 为 在 时 间 控 制 首次 经 过 其 声明 时 发 生 。 对 于 多 个 
调用 该 函数 的 线程 ， 这 意味 着 可 能 会 有 针对 定义 “首次 ”的 竞争 条 件 。 在 许多 
C++11 之 前 的 编译 器 上 ， 这 个 竞争 条 件 在 实践 中 是 有 问题 的 ， 因 为 多 个 线程 可 能 
都 认为 它们 是 第 一 个 ， 并 试图 去 初始 化 该 变量 ， 又 或 者 线程 可 能 会 在 初始 化 已 在 
另 一 个 线程 上 启动 但 尚未 完成 之 时 试图 使 用 它 。 在 C++11 中 ， 这 个 问题 得 到 了 解 
决 。 初 始 化 被 定义 为 只 发 生 在 一 个 线程 上 ， 并 且 其 他 线程 不 可 以 继续 直到 初始 化 
完成 ， 所 以 竞争 条 件 仅 仅 在 于 哪个 线程 会 执行 初始 化 ， 而 不 会 有 更 多 别 的 问题 。 
对 于 需要 单一 全 局 实例 的 场合 ， 这 可 以 用 作 std: :cal1_once 的 替代 品 。 


class my_class; 

my_class& get my class instance() 

( Q 初始 化 保证 线程 是 
static my_class instance; < 一 ”安全 的 
return instance; 


) 


多 个 线程 可 以 继续 安全 地 调用 get_my_class_instance()@， 而 不 必 担 心 
初始 化 时 的 竞争 条 件 。 


保护 仅 用 于 初始 化 的 数据 是 更 普 衣 的 场景 下 的 一 个 特例 ， 那 些 很 少 更 新 的 数 
据 结构 。 对 于 大 多 数 时 间 而 言 ， 这 样 的 数据 结构 是 只 读 的 ， 因 而 可 以 尝 无 顾忌 地 


被 多 个 线程 同时 读 取 ， 但 是 数据 结构 偶尔 可 能 需要 更 新 。 这 里 我 们 所 需要 的 是 一 
种 承认 这 一 事实 的 保护 机 制 。 


3.3.2 ”保护 很 少 更 新 的 数据 结构 


假设 有 一 个 用 于 存储 DNS 条 目 绥 存 的 表 ， 它 用 来 将 域名 解析 为 相应 的 IP 地 
址 。 通 常 ， 一 个 给 定 的 DNS 条 目 将 在 很 长 一 段 时 间 里 保持 不 变 一 一 在 许多 情况 
下 ，DNS 条 目 会 保持 数 年 不 变 。 虽 然 随 着 用 户 访问 不 同 的 网 站 ， 新 的 条 目 可 能 会 
被 不 时 地 添加 到 表 中 ， 但 这 一 数据 却 将 在 其 整个 生命 中 基本 保持 不 变 。 定 期 检查 
目的 有 效 性 是 很 重要 的 ， 但 是 只 有 在 细节 已 有 实际 改变 的 时 候 才 会 需要 更 


虽然 更 新 是 罕见 的 ， 但 它们 仍然 会 发 生 ， 并 且 如 果 这 个 缓存 可 以 从 多 个 线程 
访问 ， 它 就 需要 在 更 新 过 程 中 进行 适当 的 保护 ， 以 确保 所 有 线程 在 读 取 缓 存 时 都 
不 会 看 到 损坏 的 数据 结构 。 


在 缺乏 完全 符合 预期 用 法 并 且 为 并 发 更 新 与 读 取 专 门 设计 《例如 在 第 6 章 和 
第 7 章 的 那些 ) 的 专用 数据 结构 的 情况 下 ， 这 种 更 新 要 求 线程 在 进行 更 新 时 独占 
访问 数据 结构 ， 直 到 它 完 成 了 操作 。 一 旦 更 新 完成 ， 该 数据 结构 对 于 多 线程 并 发 
访问 又 是 安全 的 了 。 使 用 std: :mutex 来 保护 数据 结构 就 因而 显得 过 于 悲观 ， 
为 这 会 在 数据 结构 没有 进行 修改 时 消除 并 发 读 取 数据 结构 的 可 能 ， 我 们 需要 的 是 
另 一 种 互 斥 元 。 这 种 新 的 互 斥 元 通 稼 称 为 读 写 (reader-writer) 互 斥 元 ， 因 为 它 
eae 由 单个 “ 写 ” 线 程 独占 访问 或 共享 ， 由 多 个 “ 读 ” 线 程 并 
访问 。 


新 的 C++ 标准 库 并 没有 直接 提供 这 样 的 互 斥 元 ， 尽 管 已 问 标 准 委员 会 提议 
Bl。 由 于 这 个 建议 未 被 接纳 ， 本 节 中 的 例子 使 用 由 Boost 库 提供 的 实现 ， 它 是 基于 
这 个 建议 的 。 在 第 8 章 中 你 会 看 到 ， 使 用 这 样 的 互 斥 元 并 不 是 万 能 药 ， 性 能 依赖 
于 处 理 器 的 数量 以 及 读 线 程 和 更 新 线程 的 相对 工作 负载 。 因 此 ， 分 析 代 码 在 目标 
系统 上 的 性 能 是 很 重要 的 ， 以 确保 额外 的 复杂 度 会 有 实际 的 收益 。 


你 可 以 使 用 boost : :shared_mutex 的 实例 来 实现 同步 ， 而 不 是 使 
用 std: :mutex 的 实例 。 对 于 更 新 操 
作 ，std: :lock_guard<boost: :shared_mutex> 和 
std: :unique lock<boost: :shared_mutex> 可 用 于 锁定 ， 以 取代 相应 的 
std: :mutex 特 化 。 这 确保 了 独占 访问 ， 就 像 std: :mutex 那 样 。 那 些 不 需要 更 新 
数据 结构 的 线程 能 够 转 而 使 用 boost : :shared_lock<boost: :shared_mutex>* 
获得 共享 访问 。 这 与 std: :unique_lock 用 起 来 正 是 相同 的 ， 除 了 多 个 线程 在 同 
一 时 间 、 同 一 boost : :share_mutex 上 可 能 会 具有 共享 锁 。 唯 一 的 限制 是 ， 如 果 
任意 一 个 线程 拥有 一 个 共享 锁 ， 试 图 获取 独占 锁 的 线程 会 被 阻塞 ， 直 到 其 他 线程 
全 都 撤回 它们 的 锁 ， 同 样 地 ， 如 果 任 意 一 个 线程 具有 独占 锁 ， 其 他 线程 都 不 能 获 
取 共 享 锁 或 独占 锁 ， 直 到 第 一 个 线程 撤回 了 它 的 锁 。 


清单 3.13 展 示 了 一 个 简单 的 如 前 面 所 描述 的 DNS 缓存 ， 使 用 std: :map 来 保存 


缓存 数据， 用 boost : :share_mutex 进 行 保护 。 


清单 3.13 ”使 用 boost::share_ mutex 保 护 数据 结构 


#include <map> 

#include <string> 

#include <mutex> 

#include <boost/thread/shared_mutex.hpp> 


class dns_entry; 


class dns_cache 
std: :map<std::string,dns entry» entries; 
mutable boost::shared mutex entry mutex; 
public: 
dus entry find_entry (std::string const& domain) const 
boost: :shared_lock<boost::shared_mutex> lk(entry mutex) ; 
std::map<std::string,dns entry»::const iterator const it- 
entries.find(domain) ; 
return (it--entries.end())?dns entry():it-»second; 
void update or add entry(std::string const& domain, 
dns entry const& dns details) 


Std::lock guard«boost::shared mutex» lk(entry mutex); 
entries [domain] =dns_details; 


-© 


-© 


在 清单 3.13 中 ，find_entry() 使 用 一 个 boost: :share_lock<> 实 例 来 保护 


它 ， 以 供 共 享 、 只 读 的 访问 @; 多 个 线程 因而 可 以 毫 无 问题 地 同时 调 
用 find_entry()。 男 一 方面 ，update_or_add_entry() 使 用 一 
个 std: :lock_guard<> 实 例 ， 在 表 被 更 新 时 提供 独占 访问 介 ; 不 仅 在 调 


用 update_or_add_entry() 中 其 他 线程 被 阻止 进行 更 新 ， 调 用 find_entry() 的 


线程 也 会 被 阻塞 。 
3.3.3 ”递归 锁 


在 使 用 std: :mutex 的 情况 下 ， 一 个 线程 试图 锁定 其 已 经 拥有 的 互 斥 元 是 错 
误 的 ， 并 且 试 图 这 么 做 将 导致 未 定义 行为 Cundefinedbehavior ) 。 然 而 ， 在 某 些 
情况 下 ， 线 程 多 次 重新 获取 同一 个 互 斥 元 却 无 需 事先 释放 它 是 可 取 的 。 为 了 这 个 
目的 ，C++ 标 准 库 提 供 了 std: :recursive_mutex。 它 就 像 std: :mutex 一 样 ， 区 
别 在 于 你 可 以 在 同一 个 线程 中 的 单个 实例 上 获取 多 个 锁 。 在 互 斥 元 能 够 被 另 一 个 


线程 锁定 之 前 ， 你 必须 释放 所 有 的 锁 ， 因 此 如 果 你 调用 lock() 三 次 ， 你 必须 也 调 
用 unlock() 三 次 。 正 确 使 用 std: :lock_guard<std: :recursive_mutex> 和 
std: :unique_lock<std: :recursive_mutex> 将 会 为 你 处 理 。 


大 多 数 时 间 ， 如 果 你 觉得 需要 一 个 递归 互 太 元， 你 可 能 反而 需要 改变 你 的 设 
计 。 弟 归 互 斥 元 常用 在 一 个 类 被 设计 成 多 个 线程 并 发 访问 的 情况 中 ， 因 此 它 具 有 
一 个 互 斥 元 来 保护 成 员 数 据 。 每 个 公共 成 员 函 数 锁定 互 斥 元 ， 进 行 工 作 ， 然 后 解 
锁 互 斥 元 。 然 而 ， 有 时 一 个 公共 成 员 函 数 调 用 妨 一 个 函数 作为 其 操作 的 一 部 分 是 
可 取 的 。 在 这 种 情况 下 ， 第 二 个 成 员 函 数 也 将 尝试 锁定 该 互 扩 元， 从 而 导致 未 定 
义 行为 。 粗 制 滥 造 的 解决 方案 ， 就 是 将 互 斥 元 改 为 递归 互 斥 元 。 这 将 允许 在 第 二 
个 成 员 函 数 中 对 互 斥 元 的 锁定 成 功 进行 ， 并 且 函 数 继续 。 


然而 ， 这 样 的 用 法 是 不 推荐 的 ， 因 为 它 可 能 导致 草率 的 想法 和 粳 糕 的 设计 。 
特别 地 ， 类 的 不 变量 在 锁 被 持 有 时 通常 是 损坏 的 ， 这 意味 着 第 二 个 成 员 函 数 需要 
工作 ， 即 便 在 被 调用 时 使 用 的 是 损坏 的 不 变量 。 通 常 最 好 是 提取 一 个 新 的 私有 成 
员 函 数 ， 该 函数 是 从 这 两 个 成 员 函 数 中 调用 的 ， 它 不 锁定 互 斥 元 〈 它 认为 互 斥 元 
己 经 被 锁定 ) 。 然 后 ， 你 可 以 仔细 想 想 在 什么 情况 下 可 以 调用 这 个 新 阔 数 以 及 在 
那些 情况 下 数据 的 状态 。 


3.4 小结 


在 本 章 中 ， 我 讨论 了 在 线程 之 间 共 享 数据 时 ， 有 问题 的 竞争 条 件 如 何 成 为 灾 
难 ， 以 及 怎样 使 用 std:mutex 和 精心 设计 接口 以 避免 它们 。 你 看 到 了 互 斥 元 不 是 
万 能 药 ， 也 有 它们 自己 的 以 死 锁 形式 出 现 的 问题 ， 尽 管 C++ 标 准 库 以 
std: :lock() 的 形式 提供 了 工具 来 帮助 避免 死 锁 。 然 后 ， 你 看 到 了 一 些 进一步 的 
技术 来 避免 死 锁 ， 接 着 简要 看 了 一 下 锁 的 所 有 权 的 转让 ， 以 围绕 着 为 锁 选 择 恰当 
的 粒度 的 问题 。 最 后 ， 我 介绍 了 为 特定 场景 提供 的 替代 的 数据 保护 工具 ， 例 如 


std::call_once()#llboost: :shared_mutex. 


然而 ， 还 有 一 件 事 我 没有 提 到 ， 就 是 等 待 来 自 其 他 线程 的 输入 。 我 们 的 线程 
安全 栈 在 栈 为 空 的 情况 下 只 是 引发 异常 ， 因 此 如 果 一 个 线程 需要 等 待 另 一 个 线程 
来 将 一 个 值 压 入 栈 中 《毕竟 ， 这 是 线程 安全 栈 的 主要 用 途 之 一 ) ， 它 将 不 得 不 反 

尝试 弹出 值 ， 如 果 引 发 异常 则 重 试 。 这 会 消耗 宝贵 的 处 理 时 间 来 进行 检查 ， 而 
没有 实际 取得 任何 进展 。 的 确 ， 不 断 地 检查 可 能 会 通过 阻止 系统 中 其 他 线程 的 运 
行 而 阻碍 进度 。 我 们 需要 的 是 以 某 种 方法 让 一 个 线程 等 待 另 一 个 线程 完成 任务 ， 
而 无 需 耗 费 CPU 时 间 。 第 4 章 构建 在 已 经 讨论 过 的 用 于 保护 共享 数据 的 工具 上 ， 介 
绍 了 C++ 中 用 于 线程 间 同 步 操作 的 各 种 机 制 ， 第 6 章 展 示 了 如 何 使 用 它们 来 构建 更 
大 的 可 复 用 的 数据 结构 。 


[1] Tom Cargill, Exception Handling: A False Sense of Security, in C++ Report 6, no. 9 
(November- December 1994). Also available at 
http://www.informit.com/content/images/020163371x/supplements/Exception Handling 


[2] Herb Sutter, Exceptional C++: 47 Engineering Puzzles, Programming Problems, 
and Solutions (Addison Wesley Professional, 1999) 


[3] Howard E. Hinnant, “Multithreading API for C++OX—A Layered Approach", C++ 
Standards Committee Paper N2094, http://www.open- 
std.org/jtc1/sc22/wg21/docs/papers/2006/n2094.html 


FAT ”同步 并 友 操 作 
本 章 主要 内 容 


。 等 待 事 件 

。 使 用 future 来 等 竺 一 次 性 事件 
。 有 时间 限制 的 等 待 

。 使 用 操作 的 同步 来 简化 代码 


在 上 一 章 中 ， 我 们 看 到 了 各 种 方法 去 保护 在 线程 间 共 享 的 数据 。 但 是 有 时 候 
你 不 只 是 需要 保护 数据 ， 还 需要 在 独立 的 线程 上 进行 同步 操作 。 例 如 ， 一 个 线程 
在 能 够 完成 其 任务 之 前 可 能 需要 等 待 男 一 个 线程 完成 任务 。 一 般 来 说 ， 希 望 一 个 
线程 等 待 特定 事件 的 发 生 或 是 一 个 条 件 变 为 true 是 常见 的 事情 。 虽 然 通 过 定期 检 
查 “ 任 务 完成 ”的 标识 或 是 在 共享 数据 中 存储 类 似 的 东西 也 能 够 做 到 这 一 点 ， 但 却 
不 其 理想 。 对 于 像 这 样 的 线程 间 同 步 操 作 的 需求 是 如 此 常见 ， 以 至 于 C++ 标 准 库 
提供 了 以 条 件 变 量 (conditionvariables) 和 期 值 (future) 为 形式 的 工具 来 处 理 
它 。 


在 本 章 中 ， 我 将 讨论 如 何 使 用 条 件 变量 和 期 值 来 等 待 事件， 以 及 如 何 使 用 它 
们 来 简化 操作 的 同步 。 


41 等 待 事件 或 其 他 条 件 


假设 你 正 乘坐 通宵 列车 旅行 。 一 个 可 以 确保 你 在 正确 的 车 站 下 车 的 方法 就 是 
整 夜 保持 清醒 并 注意 火车 停靠 的 地 方 。 你 不 会 误 站 ， 但 你 到 那儿 时 就 会 觉得 很 
累 。 或 者 ， 你 可 以 但 一 下 时 间 表 ， 了 解 火车 会 在 何 时 到 达 ， 将 曾 钟 定 的 稍微 提前 
一 点 ， 然 后 去 睡觉 。 这 是 可 以 的 ， 你 不 会 错过 站 ， 但 是 如 果 火 车 晚点 了 ， 你 就 会 
醒 得 太 早 。 也 有 可 能 闹钟 的 电池 没 电 了 ， 你 就 会 睡 过 头 以 至 于 错过 站 。 理 想 的 状 
况 是 ， 你 只 管 去 睡觉 ， 让 某 个 人 或 茶 个 东西 在 火车 到 站 时 叫 醒 你 ， 无 论 何 时 。 


这 如 何 与 线程 相关 呢 ? 那么 ， 如 果 一 个 线程 正 等 待 着 第 二 个 线程 完成 一 项 任 
务 ， 它 有 几 个 选择 。 首 先 ， 它 可 以 一 直 检 查 共 享 数据 《由 互 斥 元 保护 ) 中 的 标 
识 ， 并 且 让 第 二 个 线程 在 完成 任务 时 设置 该 标识 。 这 有 两 项 浪费 ， 线 程 占用 了 宝 
贵 的 处 理 时 间 去 反复 检查 该 标识 ， 以 及 当 互 斥 元 被 等 待 的 线程 锁定 后 ， 就 不 能 被 
任何 其 他 线程 锁定 。 两 者 都 反对 线程 进行 等 待 ， 因 为 它们 限制 了 等 待 中 的 线程 的 
可 用 资源 ， 甚 至 阻止 它 在 完成 任务 时 设置 标识 。 这 类 似 于 整 夜 保持 清醒 地 与 火车 
司机 交谈 ， 他 不 得 不 把 火车 开 得 更 慢 ， 因 为 你 一 直 在 干扰 他 ， 所 以 需要 更 长 的 时 
间 才 能 到 达 。 同 样 的 ， 等 待 中 的 线程 消耗 了 本 可 以 被 系统 中 其 他 线程 使 用 的 资 
源 ， 并 且 最 终 等 待 的 时 间 可 能 会 比 所 需 的 更 长 。 


第 二 个 选择 是 使 用 std: :this_thread::sleep for() 函 数 ( 参 见 4.3 节 ) ， 
让 等 待 中 的 线程 在 检查 之 间 休 有 眠 一 会 儿 。 


bool flag; 
std::mutex m; 


void wait for flag() 
( 
std::unique lockestd::mutex» lk(m); 解锁 互 斥 元 
while (!flag) 
( 休 眼 100 毫秒 @ 
lk.unlock(); < 
std::this thread::sleep for(std::chrono::milliseconds(100));  «— 
lk.lock(); 


<j 
; } 6 重新 锁定 互 斥 元 


在 这 个 循环 里 ， 函 数 在 休眠 之 前 全 解锁 该 互 斥 元 @， 并 在 之 后 再 次 锁定 之 
合 ， 所 以 男 一 个 线程 有 机 会 获取 它 并 设置 标识 。 


这 是 一 个 进步 ， 因 为 线程 在 休眠 时 并 不 浪费 处 理 时间 ， 但 得 到 正确 的 休眠 时 
间 是 很 难 的 。 检 查 之 间 休 虐 得 过 短 ， 线 程 仍然 会 浪费 处 理 时 间 进 行 检查 ;休眠 得 
过 长 ， 即 使 线程 正在 等 待 的 任务 已 经 完成 ， 它 还 会 继续 休眠 ， 导 致 延迟 。 这 种 过 
度 休眠 很 少 直接 影响 程序 的 操作 ， 但 它 可 能 意味 着 在 快 节 委 的 游戏 中 丢 帧 ， 或 者 
在 实时 应 用 程序 中 过 度 运 行 一 个 时 间 户 。 


第 三 个 选择 ， 同 时 也 是 首选 选择 ， 是 使 用 C++ 标准 库 提 供 的 工具 来 等 待 事件 
本 身 。 等 待 由 另 一 个 线程 触发 一 个 事件 的 最 基本 机 制 〈 例 如 前 面 提 到 的 管道 中 存 
在 的 额外 操作 ) 是 条 件 变 量 Cconditionvariable) 。 从 概念 上 说 ， 条 件 变量 与 某 
些 事件 或 其 他 条 件 相 关 ， 并 且 一 个 或 多 个 线程 可 以 等 待 该 条 件 被 满足 。 当 某 个 线 
程 已 经 确定 条 件 得 到 满足 ， 它 就 可 以 通知 一 个 或 多 个 正在 条 件 变 量 上 进行 等 竺 的 
线程 ， 以 便 唤 醒 它 们 并 让 它们 继续 处 理 。 


4.1.1 用 条 件 变量 等 待 条 件 


标准 C++ 库 提供 了 两 个 条 件 变 量 的 实现 : std::condition variable 和 
std: :condition_variable_any。 这 两 个 实现 都 在 <condition_variable> 库 
的 头 文件 中 声明 。 两 者 都 需要 和 互 斥 元 一 起 工作 ， 以 便 提 供 恰 当 的 同步 ， 前 者 仅 
限于 和 std: :mutex 一 起 工作 ， 而 后 者 则 可 以 与 符合 成 为 类 似 互 斥 元 的 最 低 标 准 
的 任何 东西 一 起 工作 ， 因 此 以 any 为 后 绥 。 

为 std: :condition_variable_any 更 加 普遍 ， 所 以 会 有 大 小 、 性 能 或 者 操作 系 
统 资源 方面 的 形式 的 额外 代价 的 可 能 ， 因 此 应 该 首 
选 std: :condition_variable， 除 非 需要 额外 的 灵活 性 。 


那么 ， 如 何 使 用 std: :condition variable 去 处 理 引 言 中 的 例子 怎么 
让 正在 等 待 工作 的 线程 休眠 ， 直 到 有 数据 要 处 理 ? 清单 4.1 展 示 了 一 种 方法 ， 你 可 


以 用 条 件 变量 来 实现 这 一 点 。 


清单 4.1 使 用 std::condition_variable 等 待 数据 


std::mutex mut; 
std: :queue<data_chunk> data_queue; 0 
std::condition variable data_cond; 


void data preparation thread() 


{ 
while (more data to prepare()) 
{ 
data chunk const data-prepare data(); 
std::lock_guard<std::mutex> 1k (mut); 
data queue .push (data); +@ 
data cond.notify one(); -+ 全 


} 


void data processing thread () 
{ 

while (true) 

{ 


std: :unique_lock<std::mutex> lk (mut) ; «D 


data cond.wait(í( 
lk, [] {return !data_queue.empty();}); <+© 
data chunk data-data queue.front(); 
data queue.pop(); 
lk.unlocki); 
process (data); 
if(is last chunk (data)) 
break; 


首先 ， 你 拥有 一 个 用 来 在 两 个 线程 之 间 传 递 数据 的 队列 @。 当 数据 就 绪 时 ， 
准备 数据 的 线程 使 用 std: : lock_guard 去 锁定 保护 队列 的 互 斥 元 ， 并 且 将 数据 压 
入 队列 中 四 .然后 ， 它 在 std: :condition_variable 的 实例 上 调 
用 notify_one() 成 员 函 数 ， 以 通知 等 待 中 的 线程 《如果 有 的 话 ) @. 


在 另外 一 侧 ， 你 还 有 处 理 线程 。 该 线程 首先 锁定 互 斥 元 ， 但 是 这 次 使 用 的 


是 std: :unique_1lock 而 不 是 std: :1ock_guard@@ 一 一 你 很 快 就 会 明白 为 什么 。 
该 线程 接 下 来 在 std: :condition variable 上 调用 wait()， 传 入 锁 对 象 以 及 表 
示 正 在 等 待 的 条 件 的 lambda 函 数 @。lambda 函 数 是 C++ 中 的 一 个 新 功能 ， 它 允许 
你 编写 一 个 匿名 函数 作为 男 一 个 表达 式 的 一 部 分 ， 它 们 非常 适合 于 为 类 似 于 
wait() 这 样 的 标准 库 函 数 指定 断言 。 在 这 个 例子 中 ， 简 单 的 lambda 函 数 [ ] 
{return !data_queue.empty();} 检 查 data_queue 是 否 不 为 empty()， 即 队列 
中 已 有 数据 准备 处 理 。 附 录 A，A.5 节 更 加 详细 地 描述 了 lambda 函 数 。 


wait() 的 实现 接 下 来 检查 条 件 〈 通 过 调用 所 提供 的 lambda 函 数 ) ， 并 在 满足 
时 返回 (lambda 函 数 返回 true) 。 如 果 条 件 不 满足 (lambda 函数 返回 
false) ，wait() 解 锁 互 斥 元 ， 并 将 该 线程 置 于 阻塞 或 等 待 状态 。 当 来 自 数 据 准 
备 线程 中 对 notify_one() 的 调用 通知 条 件 变量 时 ， 线 程 从 睡眠 状态 中 苏醒 〈 解 
除 其 阻塞 ) ， 重 新 获得 互 斥 元 上 的 锁 ， 并 再 次 检查 条 件 ， 如 果 条 件 已 经 满足 ， 就 
从 wait() 返 回 值 ， 互 斥 元 仍 被 锁定 。 如 果 条 件 不 满足 ， 该 线程 解锁 互 斥 元 ， 并 恢 
复 等 待 。 这 就 是 为 什么 需要 std: :unique_1lock 而 不 是 std: : lock guard—— 
等 待 中 的 线程 在 等 待 期间 必须 解锁 互 斥 元 ， 并 在 这 之 后 重新 将 其 锁定 ， 
而 std: :1ock_guard 没 有 提供 这 样 的 灵活 性 。 如 果 互 斥 元 在 线程 休眠 期 间 始 终 被 
锁定 ， 数 据 准 备 线程 将 无 法 锁定 该 互 斥 元 ， 以 便 将 项 目 添加 至 队列 ， 并 且 等 待 中 
的 线程 将 永远 无 法 看 到 其 条 件 得 到 满足 。 


清单 4.1 为 等 待 使 用 了 一 个 简单 的 lambda 函 数 @， 该 函数 检查 队列 是 否 为 非 空 
的 ， 但 是 任何 函数 或 可 调用 对 象 都 可 以 传 入 。 如 果 你 已 经 有 一 个 函数 来 检查 条 件 
《也许 因为 它 比 这 样 一 个 简单 的 试验 更 加 复杂 ) ， 那 么 这 个 函数 就 可 以 直接 传 
入 ， 没 有 必要 将 其 封装 在 lambda 中 。 在 对 wait() 的 调用 中 ， 条 件 变量 可 能 会 对 所 
提供 的 条 件 检查 任意 多 次 。 然 而 ， 它 总 是 在 互 斥 元 被 锁定 的 情况 下 这 样 做 ， 并 且 
当 《〈 且 仅 当 ) 用 来 测试 条 件 的 函数 返回 true， 它 就 会 立即 返回 。 当 等 待 线程 重新 
获取 互 斥 元 并 检查 条 件 时 ， 如 果 它 并 非 直接 啊 应 必 一 个 线程 的 通知 ， 这 惑 是 所 谓 
的 伪 唤 醒 (spurious wake) 。 由 于 所 有 的 这 种 伪 唤 醒 的 次 数 和 频率 根据 定义 是 不 
确定 的 ， 所 以 使 用 对 于 条 件 检查 具有 副作用 的 函数 是 不 可 取 的 。 如 果 你 这 样 做 ， 
就 必须 做 好 多 次 产生 副作用 的 准备 。 

解锁 std: :unique_lock 的 灵活 性 不 仅 适 用 于 对 wait() 的 调用 ; 它 还 可 用 于 
你 有 待 处 理 但 仍 未 处 理 的 数据 @。 处 理 数 据 可 能 是 一 个 耗 时 的 操作 ， 并 且 如 你 在 
第 3 章 中 看 到 的 ， 在 互 斥 元 上 持 有 锁 超 过 所 需 的 时 间 就 是 个 不 好 的 情况 。 

清单 4.1 所 示 的 使 用 队列 在 线程 之 间 传 输 数 据 ， 是 很 常见 的 场景 。 做 得 好 的 


话 ， 同 步 可 以 被 限制 在 队列 本 身 ， 大 大 减少 了 同步 问题 和 竞争 条 件 大 概 的 数量 。 
鉴于 此 ， 现 在 让 我 们 从 清单 4.1 中 提取 一 个 泛 型 的 线程 安全 队列 。 


4.1.2 ”使 用 条 件 变 量 建立 一 个 线程 安全 队列 
如 果 你 要 设计 一 个 泛 型 队列 ， 花 几 分 钟 考 虑 一 下 可 能 需要 的 操作 是 值得 的 ， 


就 像 你 在 3.2.3 节 对 线程 安全 堆栈 所 做 的 那样 。 让 我 们 看 一 看 C++ 标准 库 来 寻找 灵 
感 ， 以 清单 4.2 所 示 的 std: :queue<> 的 容器 适配器 的 形式 。 


清单 4.2 std::queue 接 口 


template «class T, class Container = std::deque<T> > 
class queue { 
public: 

explicit queue (const Containerk&); 

explicit queue(Container&& = Container()); 


template «class Alloc» explicit queue (const Alloc&); 

template «class Alloc» queue (const Container&, const Alloc&); 
template «class Alloc» queue(Container&&, const Alloc&); 
template «class Alloc» queue(í(queue&&, const Alloc&); 


void swap(queue& q); 


bool empty () const; 
size type size() const; 


T& front(); 

const T& frontí() const; 
T& back(); 

const T& backí() const; 


void push(const T& x); 
void push(T&& x); 


void pop(); 
template «class... Args» void emplace(Args&&... args); 


}; 


如 果 忽 略 构造 函数 、 赋 值 和 交换 操作 ， 那 么 还 剩 下 3 组 操作 : 查询 整个 队列 
的 状态 Cempty()flsize()) 、 碍 询 队列 的 元 素 〈front() 和 back()) 以 及 修改 
队列 (push()、pop() 和 emplace()) 。 这 些 操作 与 你 之 前 在 3.2.3 节 中 对 堆栈 的 
操作 是 相同 的 ， 因 此 你 也 遇 到 相同 的 有 关 接 口中 固有 的 竞争 条 件 的 问题 。 所 以 ， 
你 需要 将 front() 和 pop() 组 合 到 单个 函数 调用 中 ， 就 像 你 为 了 堆栈 而 组 合 top() 
和 pop() 那 样 。 清 单 4.1 中 的 代码 增加 了 新 的 细微 差别 ， 但 是 ， 当 使 用 队列 在 线程 
间 传 递 数 据 时 ， 接 收 线程 往往 需要 等 待 数据 。 我 们 为 pop( ) 提 供 了 两 个 变 
fk: try_pop()， 它 试图 从 队列 中 弹出 值 ， 但 总 是 立即 返回 《〈 带 有 失败 指示 
符 ) ， 即 使 没有 能 获取 到 值 。 以 及 wait_and_pop()， 它 会 一 直 等 待 ， 直 到 有 值 
要 获取 。 如 果 将 栈 示 例 中 的 特征 带 到 此 处 ， 则 接口 看 起 来 如 清单 4.3 所 示 。 


清单 4.3 ”threadsafe_queue 的 接口 


#include <memory> +H 为 了 std::shared_ptr 


template<typename T> 

class threadsafe_queue 

{ 

public: 
threadsafe queue(í); 
threadsafe queue(const threadsafe queue&); 
threadsafe queue& operator-( 


const threadsafe queue&) = delete; «A 为 简单 起 见 不 允 许 
void push(T new value); 
bool try pop(T& value); 0 
std::shared ptr«T» try pop(); 4 € 


void wait and pop(T& value); 
std::shared ptr<T> wait and pop(); 


bool empty() const; 


就 像 你 为 堆栈 做 的 那样 ， 减 少 构造 函数 并 消除 赋值 以 简化 代码 。 如 以 前 一 
样 ， 还 提供 了 try_pop() 和 wait_and_pop() 的 两 个 版 本 。try_pop() 的 第 一 个 
重 载 @ 将 获取 到 的 值 存储 在 引用 变量 中 ， 所 以 它 可 以 将 返回 值 用 作 状 态 ; 如 果 它 
获取 到 值 就 返回 true， 和 否则 返回 false (参见 A.2 节 ) 。 第 二 个 重 载 @ 不 能 这 么 
ee 但 是 如 果 没 有 值 可 被 获取 ， 则 返回 的 指针 可 以 
设置 为 NULL。 


那么 ， 所 有 这 一 切 如 何 与 清单 4.1 关 联 起 来 呢 ? 喝 ， 你 可 以 从 那里 提取 
push() 以 及 wait_and_pop() 的 代码 ， 如 清单 4.4 所 示 。 


清单 4.4 从 清单 4.1 中 提取 push0 和 wait_and_pop() 


#include «queue» 
#include <mutex> 
#include <condition_variable> 


template<typename T> 
class threadsafe_queue 
{ 
private: 
std: :mutex mut; 
std: :queue<T> data_queue; 
std::condition variable data_cond; 
public: 
void push(T new_value) 
{ 
Std::lock guard<std::mutex> lk(mut); 
data queue.pushínew value); 
data cond.notify one(); 


} 


void wait_and_pop(T& value) 

{ 
std::unique lock«std::mutex» 1k(mut) ; 
data_cond.wait (1k, [this] {return !data_queue.empty();}); 
value-data queue.front(); 
data queue.pop(); 


E 
threadsafe queue«data chunk» data queue; 0 


void data preparation thread() 


{ 
while(more data to prepare()) 
{ 
data chunk const data-prepare data(); 
data queue.push (data); -© 


} 


void data processing thread () 


{ 

while (true) 

{ 
data_chunk data; 
data queue.wait and pop (data); «e 
process (data); 
if(is last chunk (data)) 

break; 


互 斥 元 和 条 件 变量 现在 包含 在 threadsafe_queue 的 实例 中 ， 所 以 不 再 需要 
单独 的 变量 @， 并 有 日 调用 push( ) 不 再 需要 外 部 的 同步 @。 此 
外 ，wait_and_pop() 负 责 条 件 变 量 等 待 @。 


wait_and_pop() 的 另 一 个 重 载 现在 很 容易 编写 ， 其 余 的 函数 几乎 可 以 一 字 
不 差 地 从 清单 3.5 中 的 栈 示 例 中 复制 过 来 。 清 单 4.5 展 示 了 最 终 的 队列 实现 。 


清单 4.5 ”使 用 条 件 变量 的 线程 安全 队列 的 完整 类 定义 


#include <queue> 
#include <memory> 
#include <mutex> 
#include <condition_variable> 


template<typename T> 
class threadsafe queue 


{ - 
private: 互 斥 元 必须 是 
mutable std::mutex mut; 可 变 的 
std: :queue<T> data queue; 
std: :condition variable data cond; 
Public: 
threadsafe queue() 
Ü 
threadsafe queue(threadsafe queue const& other) 
{ 
Std::lock guard«std::mutex» lk(other.mut); 
data queue-other.data queue; 


) 


void push(T new value) 

{ 
std::lock_guard<std::mutex> 1k(mut) ; 
data queue.push(new value); 
data cond.notify one(); 


) 


void wait and pop(T& value) 

{ 
std: :unique_lock<std::mutex> lkímut); 
data_cond.wait (1k, [this] {return !data_queue.empty({)};}); 
valuesdata queue.front(); 
data queue.pop(í); 


std::shared ptr«T» wait and pop() 


std::unique lock«std::mutex» 1k(mut) ; 

data cond.wait(lk, [this] {return !data queue.empty();]); 
std::shared ptr«T» res(std::make shared«T»(data queue.front())); 
data queue.pop(); 

return res; 


) 


bool try pop(T& value) 


std::lock guard«std::mutex» lk(mut); 
if(data queue.empty()) 
return false; 
valuesdata queue.front(); 
data queue.pop(); 
return true; 


std::shared ptr«T» try pop(í) 


std: :lock guard«std::mutex» lk(mut); 
if(data queue.empty()) 
return std::shared ptr<T>(); 
std: :shared ptr«T» res(std::make shared-T» (data queue.front())); 
data queue.popí); 


return res; 


} 


bool empty() const 


{ 


std: :lock_guard<std::mutex> 1k(mut) ; 
return data_queue.empty(); 


虽然 empty() 是 一 个 const 成 员 函 数 ， 并 且 拷 贝 构造 函数 的 other 参数 是 一 
个 const 引 用 ， 但 是 其 他 线程 可 能 会 有 到 该 对 象 的 非 const 引 用 ， 并 调用 可 变 的 


成 员 函 数 ， 所 以 我 们 仍然 需要 锁定 互 斥 元 。 由 于 锁定 互 斥 元 是 一 种 可 变 的 操作 ， 
故 互 斥 元 对 象 必 须 标 记 为 nutable@， 以 便 其 可 以 被 锁定 在 empty() 和 找 贝 构造 
函数 中 。 


条 件 变量 在 多 个 线程 等 竺 同一 个 事件 的 场合 也 是 很 有 用 的 。 如 果 线 程 被 用 于 
划分 工作 负载 ， 那 么 应 该 只 有 一 个 线程 去 响应 通知 ， 可 以 使 用 与 清单 4.1 中 所 示 完 
全 相同 的 结构 ， 只 要 运行 多 个 数据 处 理 线程 的 实例 。 当 新 的 数据 准备 就 
绪 ，notify_one() 的 调用 将 触发 其 中 一 个 正在 执行 wait() 的 线程 去 检查 其 条 
件 ， 然 后 从 wait( ) 返 回 ( 因 为 你 刚 向 data_queue 中 增加 了 一 项 ) 。 谁 也 不 能 保 
证 哪个 线程 会 被 通知 到 ， 即 使 是 某 个 线程 正在 等 竺 通知， 所 有 的 处 理 线程 可 能 
在 处 理 数据 。 


另 一 种 可 能 性 是 ， 多 个 线程 正 等 待 着 同一 个 事件 ， 并 且 它 们 都 需要 作出 啊 
应 。 这 可 能 发 生 在 共享 数据 正在 初始 化 的 场合 下 ， 处 理 线 程 都 可 以 使 用 同一 个 数 
据 ， 但 需要 等 待 其 初始 化 完成 《虽然 有 比 这 更 好 的 机 制 ， 参 见 第 3 章 中 的 3.3.1 
THO ， 或 者 是 线程 需要 等 竺 共享 数据 更 新 的 地 方 ， 比 如 周期 性 的 重新 初始 化 。 在 
这 些 案 例 中 ， 准 备 数据 的 线程 可 以 在 条 件 变量 上 调用 notify_al1() 成 员 冰 数 而 
不 是 notify_one()。 顾 名 思 义 ， 这 将 导致 所 有 当前 执行 着 wait( ) 的 线程 检查 其 
等 待 中 的 条 件 。 


如 果 等 待 线程 只 打算 等 竺 一次， 那么 当 条 件 为 true 时 它 就 不 会 再 等 待 这 个 条 
件 变量 了 ， 条 件 变 量 未 必 是 同步 机 制 的 最 佳 选择 。 如 果 所 等 待 的 条 件 是 一 个 特定 
数据 块 的 可 用 性 时 ， 这 尤其 正确 。 在 这 个 场景 中 ， 使 用 期 值 “future) 可 能 会 更 


合适 。 


42 ”使 用 future 等 待 一 次 性 事件 


假设 你 要 乘 飞 机 去 国外 度假 。 在 到 达 机 场 并 且 完 成 了 各 种 值 机 手续 后 ， 你 仍 
然 需要 等 待 航 班 准备 登 机 的 通知 ， 也 许 要 儿 个 小 时 。 当 然 ， 你 可 以 找到 一 些 方法 
来 消磨 时 间 ， 比 如 看 书 、 上 网 或 者 在 昂贵 的 机 场 咖啡 厅 吃 东西 ， 但 是 从 根本 上 来 
说 ， 你 只 是 在 等 待 一 件 事情 : 登 机 时 间 到 了 的 信号 。 不 仅 如 此 ， 一 个 给 定 的 航班 
只 进行 一 次 ; 你 下 次 去 度假 的 时 候 ， 就 会 等 待 不 同 的 航班 。 


C++ 标准 库 使 用 future 为 这 类 一 次 性 事件 建 模 。 如 果 一 个 线程 需要 等 待 特定 
的 一 次 性 事件 ， 那 么 它 就 会 获取 一 个 future 来 代表 这 一 事件 。 然 后 ， 该 线程 可 以 周 
期 性 地 在 这 个 future 上 等 待 一 小 段 时 间 以 检查 事件 是 否 发 生 【〈 检 查 出 发 告示 板 ) ， 
而 在 检查 间隙 执行 其 他 的 任务 《在 高 价 咖啡 厅 吃 东西 ) 。 另 外 ， 它 还 可 以 去 做 另 
外 一 个 任务 ， 直 到 其 所 需 的 事件 已 发 生 才 继续 进行 ， 随 后 就 等 待 future 变 为 就 绪 
(ready) 。future 可 能 会 有 与 之 相关 的 数据 (比如 你 的 航班 在 哪个 登 机 口 登 
BD ， 或 可 能 没有 。 一 旦 事件 已 经 发 生 《〈 即 future 已 变 为 就 绪 ) ，future 就 无 法 复 


位 。 


C++ 标准 库 中 有 两 类 future， 是 由 <future> 库 的 头 文件 中 声明 的 两 个 类 模板 
实现 的 : 唯一 future (unique futures, std::future<>) 和 共享 future (shared 
futures, std::shared future«») 。 这 两 个 类 模板 是 参照 std: :unique_ptr 和 
std: :shared_ptr 建 立 的 。std: :future 的 实例 是 仅 有 的 一 个 指向 其 关联 事件 的 
实例 ， 而 多 个 std: :shared_future 的 实例 则 可 以 指向 同一 个 事件 。 对 后 者 而 
言 ， 所 有 实例 将 同时 变 为 就 绪 ， 并 且 它 们 都 可 以 访问 所 有 与 该 事件 相关 联 的 数 
据 。 这 些 关联 的 数据 ， 就 是 这 两 种 future 成 为 模板 的 原因 : 像 std: :unique_ptr 
和 std: :shared_ptr 一 样 ， 模 板 参数 就 是 关联 数据 的 类 
Æl, std:future«void». std::shared future<void> 模 板 特 化 应 该 用 于 无 关 
联 数据 的 场合 。 虽 然 future 被 用 于 线程 间 通 信 ， 但 是 future 对 象 本 身 却 并 不 提供 同 
步 访 问 。 如 果 多 个 线程 需要 访问 同一 个 future 对 象 ， 它 们 必须 通过 互 斥 元 或 其 他 同 
步 机 制 来 保护 访问 ， 如 第 3 章 中 所 述 。 然 而 ， 正 如 你 将 在 4.2.5 节 中 看 到 的 ， 多 个 
线程 可 以 分 别 访问 自己 的 std: :shared future<> 副 本 而 无 需 进 一 步 的 同步 ， 即 
使 它们 都 指向 同一 个 异步 结果 。 


最 基本 的 一 次 性 事件 是 在 后 台 运 行 着 的 计算 结果 。 早 在 第 2 章 中 你 就 看 到 过 
std: :thread 并 没有 提供 一 种 简单 的 从 这 一 任务 中 返回 值 的 方法 ， 我 保证 这 将 在 
第 4 章 中 通过 使 用 future 加 以 解决 一 现在 是 时 候 去 看 看 如 何 做 了 。 

42.1 从 后 台 任 务 中 返回 值 


假设 你 有 一 个 长 期 运行 的 计算 ， 预 期 最 终 将 得 到 一 个 有 用 的 结果 ， 但 是 现 
在 ， 你 还 不 需要 这 个 值 。 也 许 你 已 经 找到 一 种 方法 来 确定 生命 、 宇 宙 及 万 物 的 答 


案 ， 这 是 从 Douglas Adamsi 那 里 偷 来 的 一 个 例子 。 你 可 以 启动 一 个 新 的 线程 来 执 
行 该 计算 ， 但 这 也 意味 着 你 必须 注意 将 结果 传 回 来 ， 因 为 std: :thread 并 没有 提 
供 直接 的 机 制 来 这 样 做 。 这 就 是 std: :async 函 数 模板 〈 同 样 声明 于 <future> 头 
文件 中 ) 的 由 来 。 


在 不 需要 立刻 得 到 结果 的 时 候 ， 你 可 以 使 用 std: :async 来 启动 一 个 异步 任 
务 (asynchronoustask) 。std: :async 返 回 一 个 std: :future 对象， 而 不 是 给 你 
一 个 std: :thread 对 象 让 你 在 上 面 等 待 ，std: :future 对 象 最 终 将 持 有 函数 的 返 
回 值 。 当 你 需要 这 个 值 时 ， 只 要 在 future 上 调用 get()， 线 程 就 会 阻塞 直到 future 
就 绕 ， 然 后 返回 该 值 。 清 单 4.6 展 示 了 一 个 简单 的 例子 。 


清单 4.6 ”使 用 std::future 获 取 异 步 任务 的 返回 值 


#include <future> 
#include <iostream> 


int find the answer to ltuae(); 

void do other stuff(); 

int main{} 

{ 
std: :future<int> the answer-std::async(find the answer to ltuae); 
do other stuff(); 
std::cout««"The answer is "««the answer.get()««std::endl; 


std: :async 多 许 你 通过 将 额外 的 参数 添加 到 调用 中 ， 来 将 附加 参数 传递 给 
函数 ， 这 与 std: :thread 是 同样 的 方式 。 如 果 第 一 个 参数 是 指向 成 员 函 数 的 指 
针 ， 第 二 个 参数 则 提供 了 用 来 应 用 该 成 员 函 数 的 对 象 〈 直 接地 ， 或 通过 指针 ， 或 
封 效 在 std: : ref 中 ) ， 其 余 的 参数 则 作为 参数 传递 给 该 成 员 函 数 。 否 则 ， 第 二 个 
及 后 续 的 参数 将 作为 参数 ， 传 递 给 第 一 个 参数 所 指定 的 函数 或 可 调用 对 象 。 和 
std: :thread 一 样 ， 如 果 参 数 是 右 值 ， 则 通过 移动 原来 的 参数 来 创建 副本 。 这 整 
允许 使 用 只 可 移动 的 类 型 同时 作为 函数 对 象 和 参数 。 请 看 清单 4.7。 


清单 4.7 使 用 std::async 来 将 参数 传递 给 函数 


#include <string> 
#include «future» 
struct X 
{ 
void foolint,std::string const&) ; 
std::string bar(std::string const&) ; 
I: 调用 p-7foo(42."hello"), 
X x; 其 中 p 是 &x 
auto fl=std::asyne (&X: : foo, &x,42, "hello") ; 
auto f2estd: :async(&X: :bar,x, "goodbye") ; 


struct Y | 调用 tmpx.bar("goodbye"), 其 
{ | 中 tmpx 是 x 的 副本 
double operator() (double); 
}; 调用 tmpy(3.141)， 其 中 tmpy 
ty 是 从 YO 移动 构造 的 
auto f3-std::async(Y(),3.141) ; < 一 
auto f4=std::async(std::ref(y),2.718); * 调用 y(2.718) 
X baz(X&) ; VES 
ave Ti 3 TT. (x3): a ; 
std::async (baz, std: :ref (x)) ; a 调用 baz(x) 
class move_only 
{ 
public: 
move only(); 
move only(move only&&) 
move only(move only const&) = delete; 
move only& operators (move only&&); 
move only& operator-(move only const&) - delete; 
void operator()(); 调用 tmp), IEF tmp 是 从 std::move(move onty()) 
构造 的 
auto £5estd::async(move_only()); < 


默认 情况 下 ，std: :async 是 否 启动 一 个 新 线程 ， 或 者 在 等 竺 future 时 任务 是 
否 同 步 运 行 都 取决 于 具体 实现 方式 。 在 大 多 数 情 况 下 这 就 是 你 所 想 要 的 ， 但 你 可 
以 在 函数 调用 之 前 使 用 一 个 额外 的 参数 来 指定 究竟 使 用 何 种 方式 。 这 个 参数 
为 std: :launch 类 型 ， 可 以 是 std: :launch::deferred， 以 表明 该 函数 调用 将 
会 延迟 ， 直 到 在 future 上 调用 wait() 或 get() 为 止 ， 或 者 
是 std: :launch::async， 以 表明 该 函数 必须 运行 在 它 自己 的 线程 上 ， 又 或 者 
是 std: :launch::deferred | std::launch::async， 以 表明 可 以 由 具体 实现 
来 选择 。 最 后 一 个 选项 是 默认 的 。 如 果 函 数 调用 被 延迟 ， 它 有 可 能 永远 都 不 会 实 
际 运 行 。 例 如 ， 


auto f6sstd::async(std::launch::async,Y(),1.2) ; < 一 在 新 线程 中 运行 
auto f7=std::async(std::launch: :deferred,baz,std::ref(x)); “ dk wait()at get() 


auto f8-std::async( 4 二 全 
std::launch::deferred | std::launch::async, 由 具体 实现 来 中 运行 
baz, std: :ref (x) }; 选择 

auto f9-std::async(baz,std::ref£f (x)) ; + 

£7.wait(); < 一 调用 延迟 了 的 函数 


正如 你 稍 后 将 在 本 章 看 到 ， 并 将 在 第 8 章 中 再 次 看 到 的 那样 ， 使 
用 std: :async 能 够 轻易 地 将 算法 转化 成 可 以 并 行 运行 的 任务 。 然 而 ， 这 并 不 是 
将 std: :future 与 任务 相关 联 的 唯一 方式 ; 你 还 可 以 通过 将 任务 封装 
在 std: :packaged_task<> 类 模板 的 一 个 实例 中 ， 或 者 通过 编写 代码 ， 
用 std: :promise<> 类 模板 显 式 设置 值 等 方式 来 实现 。std: :packaged_task 是 
比 std: :promise 更 高 层次 的 抽象 ， 所 以 我 将 从 它 开 始 。 


4.2.2 ”将 任务 与 future 相 关联 


std: :packaged_task<> 将 一 个 future 绑 定 到 一 个 函数 或 可 调用 对 象 上 。 

当 std: :packaged_task<> 对 象 被 调用 时 ， 它 就 调用 相关 联 的 函数 或 可 调用 对 
象 ， 并 且 让 future 就 绪 ， 将 返回 值 作 为 关联 数据 储存 。 这 可 以 被 用 作 线 程 池 的 构件 
《参见 第 9 章 ) ， 或 者 其 他 任务 管理 模式 ， 例 如 在 每 个 任务 自己 的 线程 上 运行 ， 
或 在 一 个 特定 的 后 台 线 程 上 按 顺 序 运 行 所 有 任务 。 如 果 一 个 大 型 操作 可 以 分 成 许 
多 上 自 包含 的 子 任务 ， 其 中 每 一 个 都 可 以 被 封装 在 一 个 std: :packaged_task<> 实 
例 中 ， 然 后 将 该 实例 传 给 任务 调度 器 或 线程 池 。 这 样 就 抽象 出 了 任务 的 详细 信 
息 ， 调 度 程序 仅 需 处 理 std: :packaged_task<> 实 例 ， 而 非 各 个 函数 。 


std: :packaged_task<> 类 模板 的 模板 参数 为 函数 签名 ， 比 如 void( KRE 
参数 无 返回 值 的 函数 ， 或 是 像 int(std: : string &, double*) 表 示 接 受 对 
std: :string 的 非 const 引 用 和 指向 double 的 指针 ， 并 返回 int 的 函数 。 当 你 构 
造 std: :packaged_task 实 例 的 时 候 ， 你 必须 传 入 一 个 函数 或 可 调用 对 象 ， 它 可 
以 接受 指定 的 参数 并 且 返 回 指定 的 返回 类 型 。 类 型 无 需 严 格 匹 配 ， 你 可 以 用 一 个 
接受 int 并 返回 float 的 函数 构造 std: :packaged task«double(double)», 
为 这 些 类 型 是 可 以 隐 式 转换 的 。 


指定 的 函数 签名 的 返回 类 型 确定 了 从 get_future() 成 员 函 数 返 回 的 std: : 
future<> 的 类 型 ， 而 函数 签名 的 参数 列表 用 来 指定 封装 任务 的 函数 调用 运算 符 的 
签名 。 例 
lll, std::packaged_task<std: :string(std: :vector<char>*, int) Wma 
类 定义 如 清单 4.8 所 示 。 


清单 4.8 std::packaged_task<> 特 化 的 部 分 类 定义 


template<> 
class packaged task«std::string(std::vector«char»*,int)» 
{ 
public: 
template<typename Callable> 
explicit packaged task (Callable&& f); 
std: :future<std:; :string> get future(); 
void operator ({) (std::vector<char>*,int); 


该 std: :packaged_task 对 象 是 一 个 可 调用 对 象 ， 它 可 以 被 封装 入 一 
个 std: :function 对 象 ， 作 为 线程 函数 传 给 std: :thread， 或 传 给 需要 可 调用 对 
象 的 另 一 个 函数 ， 或 者 干脆 直接 调用 。 当 std: :packaged task 作为 函数 对 象 被 
调用 时 ， 提 供给 函数 调用 运算 符 的 参数 被 传 给 所 包含 的 函数 ， 并 且 将 返回 值 作为 


异步 结果 ， 存 储 在 由 get_future() 获 取 的 std: :future 中 。 因 此 ， 你 可 以 将 任 
务 封装 在 std: :packaged_task 中 ， 并 且 在 把 std: :packaged_task 对 象 传 到 别 
的 地 方 进行 适当 调用 之 前 获取 future。 当 你 需要 结果 时 ， 你 可 以 等 待 future 变 为 就 
绪 ， 清 单 4.9 的 例子 实际 展示 了 这 一 点 。 
在 线程 之 间 传 递 任务 

许多 GUI 框架 要 求 从 特定 的 线程 来 完成 GUI 的 更 新 ， 所 以 ， 如 果 另 一 个 线程 
需要 更 新 GUI， 它 必须 癌 正 确 的 线程 发 送 消息 来 实现 这 一 
点 。std: :packaged_task 提 供 了 一 种 更 新 GUI 的 方法 ， 该 方法 无 需 为 每 个 与 GUI 
相关 的 活动 获取 自 定 义 的 消息 。 

清单 4.9 使 用 std::packaged_task 在 GUI 线程 上 运行 代码 


#include <deque> 
#include <mutex> 
#include «future» 
#include <thread> 
#include «utility» 


std: :mutex m; 
std: :deque<std: :packaged task<void{)> > tasks; 


bool gui shutdown message received(); 
void get and process qui message (}; 


void gui thread() 0 
{ 
while (!gui_shutdown message receivedí)) 
{ 
get and process gui message (); 
std: :packaged_task<void({)> task; 
{ 
std: :lock_ quard<std::mutex> lkím); 
if (tasks.empty ()) 
continue; 
task=std: :move(tasks.front()); 
tasks.pop front (}; 
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} 
task0; <+@ 


} 


std::thread gui bg thread(gui thread); 


template<typename Func> 
std::future«void» post task for gui thread(Func f) 


{ 


std: :packaged_task<void()> task(f); —9 

std: (futuré<void>. res=Cask.gét future (t); + 
std::lock guard<std: :mutex> lkím); 

tasks .push_back (std: :move (task) ) ; -© 


return res; 


此 代码 非常 简单 :GUI 线程 @ 循 环 直 到 收 到 通知 GUI 停 止 的 消息 人 @， 反 复 轮 
询 待 处 理 的 GUI 消 息 @， 比 如 用 户 点 击 ， 以 及 任务 队列 中 的 任务 。 如 果 队 列 中 没 
有 任务 @， 则 再 次 循环 ， 否则 ， 从 任务 队列 中 提取 任务 加 ， 解 除 队 列 中 的 锁 ， 并 
运行 任务 @。 当 任务 完成 时 ， 与 该 任务 相关 联 的 future 被 设 为 就 绪 。 


在 队列 上 发 布 任务 也 同样 简单 :利用 所 提供 的 函数 创建 一 个 新 的 任务 包 @， 
通过 调用 get_future() 成 员 浮 数 从 任务 中 获取 future， 同 时 在 返回 future 到 调用 
处 之 前 @ 将 任务 图 于 列表 之 上 人 @。 发 出 消息 给 GUI 线程 的 代码 如 果 需 要 知道 任务 
已 完成 ， 则 可 以 等 待 该 future; 若 无 需 知道 ， 则 可 以 丢弃 该 future。 


本 示例 中 的 任务 使 用 std:packaged_task<void()>， 它 封装 了 一 个 接受 
参数 旦 返回 void 的 函数 或 可 调用 对 象 ( 如 果 它 返回 了 别 的 东西 ， 则 返 RET 
JE) 。 这 是 最 简单 的 任务 ， 但 如 你 在 前 面 所 看 到 的 ，std:packaged_task 也 可 以 
J 通过 指定 一 个 不 同 的 函数 签名 作为 模板 参数 ， 你 可 以 改变 
j 型 《以 及 在 future 的 关联 状态 中 存储 的 数据 类 型 和 函数 调用 运算 符 的 参数 
类 型 。 AGE DLE RR RS RE 让 那些 在 GUI 线程 上 运行 的 任务 接受 参 
数 ， 并 且 返 回 std: :future 中 的 值 ， 而 不 是 仅 一 个 完成 指示 符 。 


那些 无 法 用 一 个 简单 函数 调用 表达 的 任务 和 那些 结 琳 可 能 来 自 不 止 一 个 地 方 
的 任务 又 当 如 何 ? 这 些 情况 都 可 以 通过 第 三 种 创建 future 的 方式 来 处 理 : 使 
用 std: :promise 来 显 式 地 设置 值 。 


4.23.3 生成 (std::])promise 


当 有 一 个 需要 处 理 大 量 网 络 连接 的 应 用 程序 时 ， 通 党 倾向 于 在 独立 的 线程 上 
分 别处 理 每 个 连接 ， 因 为 这 能 使 得 网 络 通 信 更 易于 理解 也 更 易于 编程 。 这 对 于 较 
低 的 连接 数 〈 因 而 线程 数 也 较 低 〉 效果 很 好 。 然 而 ， 随 着 连接 数 的 增加 ， 这 就 变 
得 不 那么 适合 了 ; 大量 的 线程 就 会 消耗 从 量 操作 系统 资源 ， 并 可 能 导致 人 量 的 上 
下 文 切换 ( 当 线 程 数 超过 了 可 用 的 硬件 并 发 ) ， 进 而 影响 性 能 。 在 极端 情况 下 ， 
操作 系统 可 能 会 在 其 网 络 连接 E 力 用 尽 之 前 ， 就 为 运行 新 的 线程 而 耗 尽 资源 。 在 
具有 超大 量 网 络 连接 的 应 用 程序 中 ， 通 常用 少量 线程 (可 能 仅 有 一 个 ) 来 处 理 连 
接 ， 每 个 线程 一 次 处 理 多 个 连接 。 


考虑 其 中 一 个 处 理 这 种 连接 的 线程 。 数 据 包 将 以 基本 上 随机 的 顺序 来 自 于 待 
处 理 的 各 个 连接 ， 同 样 地 ， 数 据 包 将 以 随机 顺序 进行 排队 发 送 。 在 多 数 情况 下 ， 
应 用 程序 的 其 他 部 分 将 通过 特定 的 网 络 连接 ， 等 竺 着 数据 被 成 功 地 发 送 或 是 新 一 
批 数据 被 成 功 地 接收 。 


std: :promise<T> 提 供 一 种 设置 值 〈《 类 型 T) 方式 ， 它 可 以 在 这 之 后 通过 相 
关联 的 std: :future<T> 对 象 进行 读 取 。 一 对 std: :promise/std: :future 为 这 
一 设施 提供 了 一 个 可 能 的 机 制 ， 等待 中 的 线程 可 以 阻塞 future， 同 时 提供 数据 的 线 
程 可 以 使 用 配对 中 的 promise 项 ， 来 设置 相关 的 值 并 使 future 就 绪 。 


m Si 


你 可 以 通过 调用 get_future() 成 员 函 数 来 获取 与 给 定 的 std: :promise 相 关 
的 std: : future 对 象 ， 比 如 std: :packaged task。 当 设置 完 promise 的 值 〈 使 
用 set_value() 成 员 函 数 ) ，future 会 变 为 就 绪 ， 并 且 可 以 用 来 获取 所 存储 的 数 
值 。 如 果 销 毁 std: :promise 时 未 设置 值 ， 则 将 存 入 一 个 异常 。4.2.4 节 描述 了 异 
常 是 如 何 跨 线程 转移 的 。 


清单 4.10 展 示 了 处 理 如 前 文 所 述 的 连接 的 示例 代码 。 在 这 个 例子 中 ， 使 用 一 
对 std: :promise<bool>/std: :future<boo1> 对 来 标识 一 块 传 出 数据 的 成 功 传 
fai; 与 future 关 联 的 值 就 是 一 个 简单 的 成 功 / 失 败 标 志 。 对 于 传 入 的 数据 包 ， 与 
future 关 联 的 数据 为 数据 包 的 负载 。 


清单 4.10 ”使 用 promise 在 单个 线程 中 处 理 多 个 连接 


#include <future> 


void process connections (connection set& connections) 


{ 
while (!done (connections) ) <0 


{ 
for (connection iterator ,9 
connection=connections.begin(),end=connections.end(}; 
connection!=end; 
++connection) 


if(connection-»has incoming data()) «e 
{ 
data packet data=connection->incoming() ; 
std: :promise<payload_type>& p= 
connection->get promise (data.id) ; «—D 
p.set value (data.payload) ; 
} 
if (connection->has_outgoing_data({)) «9 
{ 
outgoing packet data= 
connection-»top of outgoing queue(); 
connection-»send(data.payload); 
data.promise.set value(true); <O 


函数 process_connections() 一 直 循 环 到 done() 返 回 true@。 每 次 循环 
中 ， 轮 流 检查 每 个 连接 @， 在 有 传 入 数据 时 获取 之 全 @ 或 是 发 送 队 列 中 的 传 出 数据 
加 .此 处 假定 一 个 输入 数据 包 具 有 ID 和 包含 实际 数据 在 内 的 负载 。 此 ID 被 映射 至 


std: :promise (可 能 是 通过 在 关联 容器 中 进行 查找 ) 四 ， 并 且 该 值 被 设 为 数据 
包 的 负载 。 对 于 传 出 的 数据 包 ， 数 据 包 取 自 传 出 队列 ， 并 实际 上 通过 此 连接 发 
送 。 一 旦 发 送 完 毕 ， 与 传 出 数据 关联 的 promise 被 设 为 true 以 表示 传输 成 功 @。 此 
映射 对 于 实际 网 络 协议 是 否 完好 ， 取 决 于 协议 本 身 ; 这 种 promise/future 风 格 的 结 
b USURIS 尽管 它 确实 与 某 些 操作 系统 文 持 的 异步 JO 具 有 相 
以 的 结构 。 


迄今 为 止 的 所 有 代码 完全 忽略 了 异常 。 虽 然 想 象 一 个 万 物 都 始终 运转 良好 的 
世界 是 美好 的 ， 但 却 不 切实 际 。 有 时 候 磁 盘 装 满 了 ， 有 时 候 你 要 找 的 东西 恰好 不 
在 那里 ， 有 时 候 网 络 故 障 ， 有 时 数据 库 损 坏 。 如 果 你 正在 需要 结果 的 线程 中 执行 
操作 ， 代 码 可 能 只 是 用 异常 报告 了 一 个 错误 ， 因 此 仅仅 因为 你 想 
Histd::packaged task 或 std: :promise， 就 限制 性 地 要 求 所 有 事情 都 正常 工 
作 是 不 必要 的 。 因 此 C++ 标 准 库 提供 一 个 简便 的 方式 ， 来 处 理 这 种 场景 下 的 异 
常 ， 并 允许 他 们 作为 相关 结果 的 一 部 分 而 保存 。 


= 


4.2.4 ”为 future 保 存 异常 


考 率 下 面 简短 的 代码 片段 。 如 果 将 -1 传 入 square_root() 函 数 ， 会 引发 一 
个 异常 ， 同 时 将 被 调用 者 所 看 到 。 


double square root (double x) 


{ 
if (x<0} 
{ 
throw std::out of range("x«0"); 
} 
return sqrt (x); 
} 


现在 假设 不 是 仅 从 当前 线程 调用 square_root (): 
double y=square rootí(-1); 
而 是 以 异步 调用 的 形式 运行 调用 : 


std: :future<double> f=std: :async (square root,-1) ; 
double y=£.get (); 

两 者 行为 完全 一 致 自 然 是 最 理想 的 ;与 y 得 到 函数 调用 的 任意 一 种 结果 一 
样 ， 如 果 调 用 f.get() 的 线程 能 像 在 单线 程 情 况 下 一 样 ， 能 够 看 到 里 面 的 异常 ， 
那 是 极 好 的 。 


实际 情况 则 是 ， 如 果 作 为 std: :async 一 部 分 的 函数 调用 引发 了 异常 ， 该 异 
贡 会 被 储存 在 future 中 ， 代 蔡 所 存储 的 值 ，future 变 为 就 绪 ， 并 且 对 get() 的 调用 
会 重新 引发 所 存储 的 异常 〈 注 : 重新 引发 的 是 原始 异常 对 象 抑或 其 副本 ，C++ 标 
准 并 没有 指定 ， 不 同 的 编译 器 和 库 在 此 问题 上 作出 了 不 同 的 选择 ) 。 这 同样 发 生 
在 将 函数 封装 入 std: :packaged_task 的 时 候 一 一 当 任 务 被 调用 时 ， 如 果 封 装 的 
函数 引发 异常 ， 该 异常 代替 结果 存 入 future， 准 备 在 调用 get() 时 引发 。 


顺理成章 ，std: :promise 在 显 式 地 函数 调用 下 提供 相同 的 功能 。 如 果 期 望 
存储 一 个 异常 而 不 是 一 个 值 ， 则 调用 set_exception() 成 员 函 数 而 不 
是 set_value()。 这 通常 是 在 引发 异常 作为 算法 的 一 部 分 时 用 在 catch 块 中 ， 将 
该 异常 填 入 promise。 


extern std::promise<double> some promise; 


try 

some_promise.set_value(calculate_value()); 

AN S 

j some promise.set exception(std::current exception(í)); 
} 


这 里 使 用 std: : current_exception() 来 获取 已 引发 的 异常 。 作 为 奉 代 ， 可 
以 使 用 std: :copy_exception() 直 接 存 储 新 的 异常 而 不 对 引发 。 


some promise.set exception(std::copy exception(std::logic error("foo "))); 


在 异常 的 类 型 已 知 时 ， 这 比 使 用 try/catch 块 更 为 简洁 ， 并 且 应 该 优先 使 
用 ， 这 不 仅仅 简化 了 代码 ， 也 为 编译 器 提供 更 多 的 优化 代码 的 机 会 。 


另 一 种 将 异常 存储 至 future 的 方式 ， 是 销毁 与 future 关 联 的 std: :promise 
或 std: :packaged _ task， 而 无 需 在 promise 上 调用 设置 函数 或 是 调用 打包 任务 。 
在 任何 一 种 情况 下 ， 如 果 future 尚 未 就 绪 ，std: :promise 
或 std: :packaged_ task 的 析 构 函数 会 将 具 
有 std: :future_errc::broken_promise 错 误 代码 的 std: :future_error 异 常 
存储 在 相关 联 的 状态 中 。 通 过 创建 future， 你 承诺 提供 一 个 值 或 异常 ， 而 通过 销毁 
该 值 或 异常 的 来 源 ， 你 违背 了 承诺 。 在 这 种 情况 下 如 果 编 译 器 没有 将 任何 东西 存 
进 future， 等 待 中 的 线程 可 能 会 永远 等 下 去 。 


到 目前 为 止 ， 所 有 的 例子 都 使 用 了 std: :future。 然 而 ，std: :future 有 其 
局 限 性 ， 最 起 码 ， 只 有 一 个 线程 能 等 竺 结果。 如 果 需 要 多 于 一 个 的 线程 等 待 同 一 
个 事件 ， 则 需要 使 用 std: :shared_future 来 代替。 


4.2.5 SA SPAS 


RE std: :future 能 处 理 从 一 个 线程 问 另 一 线程 转移 数据 所 需 的 全 部 必要 的 
同步 ， 但 是 调用 某 个 特定 的 std: :future 实 例 的 成 员 函 数 却 并 没有 相互 同步 。 如 
果 从 多 个 线程 访问 单个 std: :future 对 象 而 不 进行 额外 的 同步 ， 就 会 出 现 数据 苋 
争 和 未 定义 行为 。 这 是 有 意 为 之 的 ，std: :future 模 型 统一 了 异步 结果 的 所 有 
权 ， 同 时 get() 的 单 发 性 质 使 得 这 样 的 并 发 访问 没有 意义 一 一 只 有 一 个 线程 可 以 
获取 值 ， 因 为 在 首次 调用 get() 后 ， 就 没有 任何 可 获取 的 值 留 下 了 。 


如 果 你 的 并 发 代码 的 绝妙 设计 要 求 多 个 线程 能 够 等 待 同 一 个 事件 ， 目 前 还 无 
需 失 去 信心 ; std: :shared_future 完 全 能 够 实现 这 一 点 。 鉴 于 std: :future 是 
仅 可 移动 的 ， 所 以 所 有 权 可 以 在 实例 间 转 移 ， 但 是 一 次 只 有 一 个 实例 指向 特定 的 
异步 结果 。std: :shared_future 实 例 是 可 复制 的 ， 因 此 可 以 有 多 个 对 象 引用 同 
一 个 相关 状态 。 


现在 ， 即 便 有 了 std: :shared future， 各 个 对 象 的 成 员 函 数 仍 然 是 不 同步 
的 ， 所 以 为 了 避免 从 多 个 线程 访问 单个 对 象 时 出 现 数据 竞争 ， 必 须 使 用 锁 来 保护 
访问 。 首 选 的 使 用 方式 ， 是 用 一 个 对 象 的 副本 来 代 蔡 ， 并 且 让 每 个 线程 访问 自己 
的 副本 。 从 多 个 线程 访问 共享 的 异步 状态 ， 如 果 每 个 线程 都 是 通过 自己 的 
std::shared future 对象 去 访问 该 状态 ， 那 么 就 是 安全 的 ， 见 图 4.1。 


线程 1 线程 2 
仁 sf 上 木 同步 的 


sf.wait() . sf.wait(í) 


线程 1 线程 2 
复制 是 安全 的 
auto local=sf; auto local=sf; 


共 至 变量 sf 


std: :shared_future<int> 


local.wait {) 独立 的 对 象 local.wait () 


所 以 没有 数据 证 争 
图 4.1 ”使 用 多 个 std::shared_future 对 象 避 免 数据 竞争 


std: :shared_future 的 一 个 潜在 用 处 ， 是 实现 类 似 复杂 电子 表格 的 并 行 执 

。 每 个 单元 都 有 一 个 单独 的 终 值 ， 可 以 被 多 个 其 他 单元 格 中 的 公式 使 用 。 用 来 
RA TR a 吉 果 的 公式 可 以 使 用 std: :shared future 来 引用 第 一 个 单元 。 
如 果 所 有 独立 单元 格 的 公式 被 并 行 执行 ， 那 些 可 以 继续 完成 的 任务 可 以 进行 ， 而 
那些 依赖 于 其 他 单元 格 的 公式 将 阻塞 ， 直 到 其 依赖 关系 准备 就 络 。 这 就 使 得 系统 
能 最 大 限度 地 利用 可 用 的 硬件 并 发 。 


引用 了 异步 状态 的 std: :shared future 实例 可 以 通过 引用 这 些 状态 的 
std: :future 实 例 来 构造 。 由 于 std: :future 对 象 不 和 其 他 对 象 共享 异步 状态 的 
所 有 权 ， 因 此 该 所 有 权 必 须 通过 std: :move 转 移 到 std: :shared_future， 

将 std: :future 留 在 空 状态 ， 就 像 它 被 默认 构造 了 一 样 。 


std: :promise<int> p; 

std: :future<int> f(p.get future()); 9 future 了 是 有 效 的 
assert (f.valid()); 4 

std::shared future<int> sf(std::move(f)); 

assert(!f.valid()); -O f 不 再 有 效 
assert (sf.valid()); © sf 现在 有 效 


此 处 ，future f 刚 开始 是 有 效 的 @， 因 为 它 引 用 了 promise p 的 异步 状态 ， 但 是 
将 状态 转移 至 sf 后 ，f 不 再 有 效 人 @， 而 sf 有 效 合 。 


正如 其 他 可 移动 的 对 象 那样 ， 所 有 权 的 转移 对 于 右 值 是 隐 式 的 ， 因 此 可 以 从 
std: :promise 对 象 的 get_future() 成 员 函 数 的 返回 值 直 接 构造 一 
个 std: :shared future， 例 如 


std: :promise<std::string> p; a 所 有 权 的 隐 式 转移 
std::shared future«std::string» sf(p.get future()); < 


此 处 ， 所 有 权 的 转移 是 隐 式 的 ，std: :shared_future<> 根 
据 std: :futurexstd::string> 类 型 的 右 值 进 行 构造 @。 


std: :future 具 有 一 个 额外 特性 ， 即 从 变量 的 初始 化 自动 推断 变量 类 型 的 功 
能 ， 使 得 std: : shared_future 的 使 用 更 加 方便 (参见 附录 A 中 A.6 
节 ) 。std::future 上 共有 一 个 share() 成 员 函 数 ， 可 以 构造 一 个 新 的 
std: :shared_future， 并 且 直 接 将 所 有 权 转 移 给 它 。 这 可 以 节省 大 量 的 录入 ， 
也 使 代码 更 易于 更 改 。 


std: :promise< std::map< SomeIndexType, SomeDataType, SomeComparator, 
SomeAllocator>::iterator> p; 
auto sf-p.get future () .share () ; 


ATL F, SFAI ALA HE W AAH 2322 AY 
std::shared future«std: :map«SomeIndexType,SomeDataType, SomeCompar 
如 果 比 较 器 或 分 配器 改变 了 ， 仅 需 改变 promise 的 类 型 ，future 的 类 型 将 自动 更 新 
PAUL fn 


有 些 时 候 ， 你 会 想 要 限制 等 待 事件 的 时 长 ， 无 论 是 因为 某 段 代码 能 够 占用 的 
时 间 有 着 硬性 的 限制 ， 还 是 因为 如 果 事 件 不 会 很 快 发 生 ， 线 程 就 可 以 去 做 其 他 有 
用 的 工作 。 为 了 处 理 这 个 功能 ， 许 多 等 待 函 数 具有 能 够 指定 超时 的 变量 。 


43 有 时 间 限 制 的 等 竺 


前 面 介绍 的 所 有 阻塞 调用 都 会 阻塞 一 个 不 确定 的 时 间 段 ， 挂 起 线程 直至 等 待 
的 事件 发 生 。 在 许多 情况 下 这 是 没 问题 的 ， 但 在 茶 些 情况 下 你 会 希望 给 等 待 时间 
加 一 个 限制 。 这 就 使 得 能 够 发 送 茶 种 形式 的 “我 还 活着 ”的 消息 给 交互 用 户 或 者 另 
一 个 进程 ， 或 是 在 用 户 已 经 放弃 等 待 并且 按 下 取消 键 时 ， 干 脆 放 弃 等 待 。 


有 两 类 可 供 指定 的 超时 : 一 为 基于 时 间 段 的 超时 ， 即 等 待 一 个 指定 的 时 间 长 
度 〈 例 如 30ms) ， 或 是 绝对 超时 ， 即 等 到 一 个 指定 的 时 间 点 《例如 世界 标准 时 间 
2011 年 11 月 30 日 17:30:15.045987023) 。 大 多 数 等 待 函数 提供 处 理 这 两 种 形式 超时 
的 变量 ， 人 处理 基于 时 间 段 超时 的 变量 具有 _for 后 级 ， 而 处 理 绝对 超时 的 变量 具有 
 until/r£&. 


wii, std::condition variable H AWS MMA wait for()JmX 5r 
数 和 两 个 重 载 版 本 的 wait_unti1l() 成 员 函 数 ， 对 应 于 两 个 重 载 版 本 的 wait() 
一 一 一 个 重 载 只 是 等 待 到 收 到 信号 ， 或 超时 ， 或 发 生 伪 唤醒 ， 男 一 个 重 载 在 唤醒 
时 检测 所 给 的 断言 ， 并 只 在 所 给 的 断言 为 rue (以 及 条 件 变 量 已 收 到 信号 〉 或 超 
时 的 情况 下 才 返 回 。 


在 细 看 使 用 超时 的 函数 之 前 ， 让 我 们 从 时 钟 开始 ， 看 一 看 在 C++ 中 是 如 何 指 
定时 间 的 。 


4.1 ”了 时钟 


就 C++ 标准 库 所 关注 的 而 言 ， 时 钟 是 时 间 信 息 的 来 源 。 有 具体 来 说 ， 时 钟 是 提 
供 以 下 四 个 不 同 部 分 信息 的 类 。 


e 现在 (now) 时 间 。 

。 用 来 表示 从 时 钟 获取 到 的 时 间 值 的 类 型 。 

。 时 钟 的 节拍 周期 。 

e 时钟 是 否 以 均匀 的 速率 进行 计时 ， 决 定 其 是 否 为 匀速 (steady) 时 钟 。 


时 钟 的 当前 时 间 可 以 通过 调用 该 时 钟 类 的 静态 成 员 函 数 now() 来 获取 。 例 
如 ，std: :chrono: :system_clock: :now() 返 回 系统 时 钟 的 当前 时 间 。 对 于 有 具 
体 某 个 时 钟 的 时 间 点 类 型 ， 是 通过 time_point 成 员 的 typedef 来 指定 的 ， 
此 some_clock: :now() 的 返回 类 型 是 some_clock: :time_point。 


时 钟 的 节拍 周期 是 由 分 数秒 指定 的 ， 它 由 时 钟 的 period 成 员 typedef 给 出 
每 秒 走 25 拍 的 时 钟 ， 就 具有 std: :ratio<1,25> 的 period， 而 每 2.5 秒 走 一 拍 
的 时 钟 则 具有 std: : ratio<5,2> 的 period。 如 果 时 钟 的 节拍 周期 直到 运行 时 方 


可 知晓 ， 或 者 可 能 所 给 的 应 用 程序 运行 期 间 可 变 ， 则 period 可 以 指定 为 平均 的 节 
拍 周期 、 最 小 可 能 的 节拍 周期 ， 或 是 编写 类 库 的 人 认为 合适 的 一 个 值 。 在 所 给 的 
一 次 程序 的 执行 中 ， 无 法 保证 观 罕 到 的 节拍 周期 与 该 时 钟 所 指定 的 period 相 符 。 


如 果 一 个 时 钟 以 均匀 速率 计时 “〈 无 论 该 时 速 是 否 匹 配 period) 且 不 能 被 调 
整 ， 则 该 时 钟 被 称 为 匀速 (steady) 时 钟 。 如 果 时 钟 是 匀速 的 ， 则 时 钟 类 的 
is_steady 静 态 数据 成 员 为 true， 反 之 为 false。 通 常情 况 
下 ，std: :chrono: :system_clock 是 不 匀速 的 ， 因 为 时 钟 可 以 调整 ， 考 虑 到 本 
地 时 钟 漂移 ， 这 种 调整 甚至 是 自动 执行 的 。 这 样 的 调整 可 能 会 引起 调用 now() 所 
返回 的 值 ， 比 之 前 调用 now( ) 所 返回 的 值 更 早 ， 这 违背 了 均匀 计时 速率 的 要 求 。 
如 你 马上 要 看 到 的 那样 ， 勾 速 时 钟 对 于 计算 超时 来 说 非常 重要 ， 因 此 C++ 标准 库 
提供 形式 为 std: :chrono: :steady_clock 的 匀速 时 钟 。 由 C++ 标准 库 提 供 的 其 
他 时 钟 包括 std: :chrono: :system_clock (上 文 已 提 到 ) ， 它 代表 系统 的 “真实 
时 间 ” 时 钟 ， 并 为 时 间 点 和 time_t 值 之 间 的 相互 转换 提供 函数 ， 还 
有 std: :chrono: :high_resolution_ clock， 它 提供 所 有 类 库 时 钟 中 最 小 可 能 
的 节拍 周期 (和 可 能 的 最 高 精度 ) 。 它 实际 上 可 能 是 其 他 时 钟 之 一 的 typedef。 
这 些 时 钟 与 其 他 时 间 工 具 都 定义 在 <chrono> 类 库 头 文件 中 。 


" 我 们 马上 要 看 看 如 何 表示 时 间 点 ， 但 在 此 之 前 ， 先 来 看 看 时 间 段 是 如 何 表示 


4.3.2 时间 段 


时 间 段 是 时 间 支 持 中 的 最 简单 部 分 ， 它 们 是 由 std: : chrono: :duration<> 
类 模板 〈 线 程 库 使 用 的 所 有 C++ 时 间 处 理工 具 均 位 于 std: :chrono 的 命名 空间 
中 ) 进行 处 理 的 。 第 一 个 模板 参数 为 所 代表 类 型 Cint, long, double) ; 
第 二 个 参数 是 个 分 数 ， 指 定 每 个 时 间 段 单位 表示 多 少 秒 。 例 如 ， 以 short 类 型 存 
储 的 几 分 钟 的 数目 表示 
为 std: :chrono: :duration<short,std::ratiox66,1>>， 因 为 1 分 钟 有 60 秒 。 
另 一 方面 ， 以 double 类 型 存储 的 毫秒 数 则 表示 
为 std: :chrono: :duration<double, std: :ratio<1,1666>>， 因 为 1 毫秒 为 
1/1000 秒 。 


标准 库 在 std: : chrono 命 名 空间 中 为 各 种 时 间 段 提供 了 一 组 预定 义 的 
typedef: nanoseconds. microseconds, milliseconds, seconds. minute: 
和 hours。 它 们 均 使 用 一 个 足够 大 的 整数 类 型 以 供 表示 ， 以 至 于 如 果 你 希望 的 
话 ， 可 以 使 用 合适 的 单位 来 表示 超过 500 年 的 时 间 段 。 还 有 针对 所 有 国际 单位 比 
例 的 typedef 可 供 指定 自 定 义 时 间 段 时 使 用 ， 从 std: :atto (1019) 至 
std::exa (1019) 〈 还 有 更 大 的 ， 若 你 的 平台 具有 128 位 整 型 类 型 ) ， 例 如 
std: :duration<double,std::centi> 是 以 double 类 型 表示 的 /100 秒 的 计时 。 


在 无 需 截断 值 的 场合 ， 时 间 段 之 间 的 转换 是 隐 式 的 《因此 将 小 时 转换 成 秒 是 


可 以 的 ， 但 将 秒 转换 成 小 时 则 不 然 ) 。 显 式 转换 可 以 通过 


std::chrono::duration cast<> 实 现 : 


std: :chrono::milliseconds ms (54802) ; 
std::chrono::seconds s= 
std: :chrono: :duration cast<std: :chrono: :seconds> (ms); 


结果 是 截断 而 非 四 舍 五 入 ， 因 此 在 此 例 中 s 值 为 54。 


时 间 段 文 持 算术 运算 ， 因此 可 以 加 、 减 时 间 段 来 得 到 新 的 时 间 段 ， 或 者 可 以 
乘 、 除 一 个 底层 表示 类 型 〈 第 一 个 模板 参数 ) 的 常数 。 因 此 5*seconds (1) 和 
seconds(5) 或 minutes(1)-seconds(55) 是 相同 的 。 时 间 段 中 单位 数量 的 计数 
可 以 通过 count() 成 员 函 数 获取 。 因 
此 std: :chrono: :milliseconds(1234).count() 731234. 


基于 时 间 段 的 等 待 是 通过 std: : chrono: :duration<> 实 例 完成 的 。 例 如 ， 
可 以 等 竺 future 就 绪 最 多 35 宣 秒 。 


std::future<int> f=std::async(some_task) ; 
if(f£.wait_for(std::chrono: :milliseconds (35) )==std::future_status::ready) 
do something with(f.get()); 


EIT RAER MRS UR SE E E, 或 者 所 等 erie 
生 。 在 这 种 情况 下 ， 你 在 等 待 一 个 future， 若 等 待 超时， 函数 返 
std::future_status:: ae 若 future 就 绪 ， 则 返回 
std: :future_status: :ready， 或 者 如 果 future 任 务 推迟 ， 则 返回 
std: :future_status::deferred。 基 于 时 间 段 的 等 待 使 用 类 库 内 部 的 匀速 时 钟 
来 衡量 时 间 ， 因 此 35 瞩 秒 意 味 着 35 片 秒 的 逝去 时 间 ， 即 便 系 统 时 钟 在 等 待 期 间 进 
行 了 调整 《向 前 或 向 后 ) 。 当 然 ， 系 统 调 度 的 多 变 和 OS 时 钟 的 不 同 精度 意味 着 线 
程 之 间 发 出 调用 并 返回 的 实际 时 间 可 能 远 远 长 于 35 毫 秒 。 


在 看 过 时 间 段 后 ， 接 下 可 以 继续 看 看 时 间 点 。 
4.3.3 时 间 点 


时 钟 的 时 间 点 是 通过 std: :chrono: :time_point<> 类 模板 的 实例 来 表示 
的 ， 它 以 第 一 个 模板 参数 指定 其 参考 的 时 钟 ， 并 且 以 第 二 个 模板 参数 指定 计量 单 
位 (std::chrono: :duration<> 的 特 化 ) 。 时 间 点 的 值 是 时 间 的 长 度 〈 指 定时 
间 段 的 倍数 ) ， 因 而 一 个 特定 时 间 点 被 称 为 时 钟 的 纪元 orl 时 钟 的 纪元 
是 一 项 基本 参数 ， 但 却 不 能 直接 查询 ， 也 未 被 C++ 标准 指定 。 典型 的 纪元 包括 
1970 年 1 月 1 日 00:00， 以 及 运行 应 用 程序 的 计算 机 引导 启动 的 瞬间 。 时 钟 可 以 共享 
纪元 或 拥有 独立 的 纪元 。 如 果 两 个 时 钟 共 享 一 个 纪元 ， 则 在 一 个 类 中 的 
time point typedef 可 指定 另 一 个 类 作为 与 time_point 相 关联 的 时 钟 类 型 。 


然 无 法 找 出 纪元 的 时 间 所 在 ， 但 可 以 获取 给 定 time_point 的 
time_since_epoch()。 该 成 员 函 数 返 回 一 个 时 间 段 的 值 ， 其 指定 了 从 时 钟 纪元 
到 该 时 间 点 的 时 间 长 度 。 


例如 ， 你 可 以 指定 一 个 时 间 点 
为 std: :chrono: :time_point<std::chrono::system_clock， 
std: :chrono: :minutes>。 这 将 保持 时 间 与 系统 时 钟 相 关 ， 但 却 以 分 钟 而 不 是 
系统 时 钟 的 固有 测量 精度 (通常 为 秒 或 更 小 ) 进行 测量 。 


你 可 以 从 std: : chrono: :time_point<> 的 实例 加 上 和 减 去 时 间 段 来 产生 新 
的 时 间 点 ， 因 此 std: :chrono: :high_resolution_clock: :now()+ 
std: : chrono: :nanoseconds(566) 将 在 future 中 给 你 500 纳 秒 的 时 间 。 这 对 于 在 
知道 代码 块 的 最 大 时 间 段 情况 下 计算 绝对 超时 是 极 好 的 ， 但 知 其 中 有 对 等 待 函 数 
的 多 个 调用 ， 或 是 在 等 待 函数 之 前 有 非 等 待 函数 ， 就 会 占据 一 部 分 时 间 预 算 。 


你 还 可 以 从 另 一 个 共享 同一 个 时 钟 的 时 间 点 减 去 一 个 时 间 点 。 结 果 为 指定 两 
个 时 间 点 之 间 长 度 的 时 间 段 。 这 对 于 代码 块 的 计时 非常 有 用 ， 例 如 ， 


auto start-std::chrono::high resolution clock::now(); 
do something(); 

auto stop=std::chrono: :high_ resolution clock::now(); 
Std::cout««"do somethingí) took " 


««Sgtd::chrono::duration«double,std::chrono::seconds»(stop-start).count () 
<<” gseconds"««std::endl; 


然而 std: :chrono: :time_point<> 实 例 的 时 钟 参 数 能 做 的 不 仅仅 是 指定 纪 
元 。 当 你 将 时 间 点 传 给 到 接受 绝对 超时 的 等 待 函数 时 ， 时 间 点 的 时 钟 参 数 可 以 用 
来 测量 时 间 。 当 时 钟 改变 时 会 产生 一 个 重要 的 影响 ， 因 为 这 一 等 得 会 跟踪 时 钟 的 
改变 ， 并 且 在 时 钟 的 now( ) 函 数 返回 一 个 晚 于 指定 超时 的 值 之 前 都 不 会 返回 。 如 
果 时 钟 向 前 调整 ， 将 减少 等 待 的 总 长 度 〔 按 照 匀速 时 钟 计量 ) ， 反 之 如 果 向 后 调 
整 ， 束 可 能 增加 等 待 的 总 长 度 。 


如 你 所 料 ， 时 间 点 和 等 竺 函数 的 _unti1 变 种 共同 使 用 。 典 型 用 例 是 在 用 作 从 
程序 中 一 个 固定 点 的 某 个 时 钟 : :now() 开 始 的 偏 移 量 ， 尽 管 与 系统 时 钟 相 关联 的 
时 间 点 可 以 通过 在 对 用 户 可 见 的 时 间 ， 

用 std: :chrono: :system clock: :to time _point() 静 态 成 员 函 数 从 time tf 
换 而 来 。 例 如 ， 如 果 有 一 个 最 大 值 为 500 塞 秒 的 时 间 ， 来 等 待 一 个 与 条 件 变 量 相 
关 的 事件 ， 你 可 以 按 清 单 4.11 所 示 来 做 。 


清单 4.11 等 待 一 个 具有 超时 的 条 件 变量 


#include <condition_variable> 
#include <mutex> 
#include <chrono> 


std::condition variable cv; 
bool done; 
std::mutex m; 


bool wait loop() 


auto const timeout= std::chrono::steady clock: :now()+ 
std::chrono: :milliseconds (500) ; 
std: :unique_lock<std::mutex> lkím); 
while (! done) 
{ 
if (¢v.wait_until (1k, timeout) ==std: :cv_status: :timeout) 
break; 


} 


return done; 


如 果 没 有 向 等 待 传递 断言 ， 那 么 这 是 在 有 时 间 限 制 下 等 待 条 件 变 量 的 推荐 方 
式 。 这 种 方式 下 ， 循 环 的 总 长 度 是 有 限 的 。 如 4.1.1 节 所 示 ， 当 不 传 入 断言 时 ， 需 
要 通过 循环 来 使 用 条 件 变 量 ， 以 便 处 理 伪 唤 醒 。 如 果 在 循环 中 使 
用 wait_for()， 可 能 在 伪 唤 醒 前 ， 就 已 结束 等 待 几 乎 全 部 时 长 ， 并 且 在 经 过 下 
一 次 等 待 开始 后 再 来 一 次 。 这 可 能 会 重复 任意 次 ， 使 得 总 的 等 待 时 间 无 穷 无 尽 。 


在 看 过 了 指定 超时 的 基础 知识 后 ， 让 我 们 来 看 看 能 够 使 用 超时 的 函数 。 
4.3.4 接受 超时 的 函数 


超时 的 最 简单 用 法 ， 是 将 延迟 添加 到 特定 线程 的 处 理 过 程 中 ， 以 便 在 它 无 所 
事 事 的 时 候 避 免 占 用 其 他 线程 的 处 理 时 间 。 在 4.1 节 你 兽 见 过 这 样 的 例子 ， 在 循环 
中 轮 询 一 个 “完成 ”标记 。 处 理 它 的 两 个 函数 
是 std: :this _ thread: :sleep for() 和 
std::this thread::sleep_until()。 它 们 像 一 个 基本 的 闸 钟 一 样 工 作 : 在 指 
定时 间 段 (使 用 sleep_for()) 或 直至 指定 的 时 间 点 〈 使 用 sleep_until()) ， 
线程 进入 睡眠 状态 。sleep_for() 对 于 那些 类 似 于 4.1 节 中 的 例子 是 有 意义 的 ， 其 
中 一 些 事 情 必须 周期 性 地 进行 ， 并 有 旦 逝去 的 时 间 是 重要 的 。 另 一 方 
面 ，sleep_until() 人 允许 安排 线程 在 特定 时 间 点 唤醒 。 这 可 以 用 来 触发 半夜 里 的 
A E 帧 的 刷 


当然 ， 睡 眠 并 不 是 唯一 的 接受 超时 的 工具 。 你 已 经 看 到 了 可 以 将 超时 与 条 件 
变量 和 fature 一 起 使 用 。 如 果 互 斥 元 文 持 的 话 ， 甚 至 可 以 试图 在 互 斥 元 获得 锁 时 使 
H. PRM std: :mutex 和 std: :recursive_mutex 并 不 支持 锁定 上 的 超 


时 ， 但 是 std: :timed_mutex 和 std: :recursive timed _mutex 支 持 。 这 两 种 类 
型 均 支 持 try_lock_for() 和 try_lock_unti1l() 成 员 函 数 ， 它 们 可 以 在 指定 时 
间 段 内 或 在 指定 时 间 点 之 前 尝试 获取 锁 。 表 4.1 展 示 了 C++ 标 准 库 中 可 以 接受 超时 
的 函数 及 其 参数 和 返回 值 。 列 作 时 间 段 〈duration) 的 参数 必须 

为 std: :duration<> 的 实例 ， 而 那些 列 作 time_point 的 必须 

为 std: :time_point<> 的 实例 。 


表 4.1 接受 超时 的 函数 


类 /命名 空间 函数 返回 值 
std::this_thread 命 名 空间 rep onuration) . 不 可 用 
sleep_until(time_point) 
std::condition_variable=\ wait_for(lock, duration) std::cv_status::timeout# 
std::condition_variable_any wait_until(lock, time_point) std::cv_status::no_ timeout 


vedic) vacancy, [bool AEM predicate 
P - f 返回 值 


time_point, predicate) 


std::timed_mutex 或 try_lock_for(duration) bool 一 true 如 果 获 得 了 锁 ， 
std::recursive_timed_mutex try_lock_until(time_point) 否则 false 


unique_lock(lockable,duration) 不 可 用 一 owns_lockO 在 新 
std::unique_lock<TimedLockable> due— 构造 的 对 象 上 ; 如 果 获 得 


unique_lock(lockable,time_point) T Bk Eluue, Blliifalse 


try_lock_for(duration) bool 一 true 如 果 获 得 了 锁 ， 
try_lock_until(time_point) 否则 false 


std::future_status::timeout 如 
果 等 待 超时 ， 


std::future<ValueType> 或 wait_for(duration) m m :Teady 如 果 


std::shared_ future<ValueType> wait_until(time_point) 


std::future_status::deferred 4] 
果 future 持 有 的 延迟 函数 还 
没有 开始 


目前 ， 我 已 经 介绍 了 条 件 变量 、future、promise 和 打包 任务 的 机 制 ， 接 下 来 
是 时 候 看 一 看 更 广 的 图 景 ， 以 及 如 何 利 用 它们 来 简化 线程 间 操 作 的 同步 。 


4.4 使 用 操作 同步 来 简化 代码 


使 用 截至 目前 在 本 章 中 描述 的 同步 工具 作为 构建 模块 ， 允 许 你 着 重 关 注 需 要 
同步 的 操作 而 非 机 制 。 一 种 可 以 简化 代码 的 方式 ， 是 采用 一 种 更 加 函数 式 的 
Cfunctional， 在 函数 式 编 程 意义 上 ) 的 方法 来 编写 并 发 程序 。 并 非 直接 在 线程 
之 间 共 享 数 据 ， 而 是 每 个 任务 都 可 以 提供 它 所 需要 的 数据 ， 并 通过 使 用 future 将 结 
果 传 播 至 需要 它 的 线程 。 


4.4.1 ” 带 有 future 的 函数 式 编程 


函数 式 编程 (functionalprogramming, FP) 指 的 是 一 种 编程 风格 ， 函 数 调用 
的 结果 仅 单 纯 依 赖 于 该 函数 的 参数 而 不 依赖 于 任何 外 部 状态 。 这 与 函数 的 数学 概 
念 相关 ， 同 时 也 意味 着 如 果 用 同一 个 参数 执行 一 个 图 数 两 次 ， 结 果 是 完全 一 样 
的 。 这 是 许多 C++ 标准 库 中 数学 函数 ， 如 sin、cos 和 sqrt， 以 及 基本 类 型 简单 操 
作 如 3+3、6*9、 或 1.3/4.7 的 特性 。 纯 函数 也 不 修改 任何 外 部 状态 ， 函 数 的 影响 
完全 局 限 在 返回 值 上 。 


这 使 得 事情 变 得 易于 思考 ， 尤 其 当 涉 及 并 发 时 ， 因 为 第 3 章 中 讨论 的 许多 与 
共 至 内 存 相关 的 问题 不 复 存在 。 如 果 没 有 修改 共享 数据 ， 那 么 就 不 会 有 竞争 条 
件 ， 因 此 也 就 没有 必要 使 用 互 斥 元 来 保护 共享 数据 。 这 是 一 个 如 此 强大 的 简化 ， 
使 得 诸如 Haskell2] 这 样 的 编程 语言 ， 在 默认 情况 下 其 所 有 函数 都 是 纯 函 数 ， 开 始 
在 编写 并 发 系统 中 变 得 更 为 流行 。 因 为 大 多 数 东西 都 是 纯 的 ， 实 际 上 的 确 修 改 共 
ee 因而 也 更 易于 理解 它们 是 如 何 纳 入 应 用 程序 


然而 函数 式 编程 的 好 处 不 仅仅 局 限 在 那些 将 其 作为 默认 范 型 的 语言 。C++ 是 
一 种 多 范 型 语言 ， 它 完全 可 以 用 FP 风 格 编写 程序 。 随 着 lambda 函 数 〈 人 参见 附录 A 
中 A.6 节 ) 的 到 来 ， 从 Boost 到 TR1 的 std: :bind 合 并 ， 和 自动 变量 类 型 推断 的 引 
入 人 参见 附录 A 中 A.7 节 ) ，C++11 比 C++98 更 为 容易 实现 函数 式 编程 。future 是 使 
得 C++ 中 FP 风格 的 并 发 切实 可 行 的 最 后 一 块 拼 图 。 一 个 future 可 以 在 线程 间 来 回 传 
使 得 一 个 线程 的 计算 结果 依赖 于 另 一 个 的 结果 ， 而 无 需 任 何 对 共享 数据 的 显 
式 访 问 。 


1. FP 风格 快速 排序 


为 了 说 明 在 FP 风 格 并 发 中 future 的 使 用 ， 让 我 们 来 看 一 个 简单 的 快速 排序 算 
法 的 实现 。 算 法 的 基本 思想 很 简单 ， 给 定 一 列 值 ， 取 一 个 元 素 作 为 中 轴 ， 然 后 将 
列表 分 为 两 组 一 一 比 中 轴 小 的 为 一 组 ， 大 于 等 于 中 轴 的 为 一 组 。 列 表 的 已 排序 副 
本 ， 可 以 通过 对 这 两 组 进行 排序 ， 并 按照 先是 比 中 轴 小 的 值 已 排序 列表 ， 接 着 是 
中 轴 ， 再 后 返回 大 于 等 于 中 轴 的 值 已 排序 列表 的 顺序 进行 返回 来 获取 。 图 4.2 展 示 


了 10 个 整数 的 列表 是 如 何 根据 此 步骤 进行 排序 的 。FP 风 格 的 顺序 实现 在 随后 的 代 
码 中 展示 ; 它 通过 值 的 形式 接受 并 返回 列表 ， 而 不 是 像 std: :sort() 那 样 就 地 排 
序 。 


4 
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图 4.2 ”FP 风格 递归 排序 
清单 4.12 ”快速 排序 的 顺序 实现 


template<typename T> 
std::list<T> sequential quick sort (std::list<T> input) 
{ 

if (input .empty ()) 


{ 
} 


std::list<T> result; 
result .splice (result .begin(),input,input.begin()}; EXE | 
T const& pivots*result.begin(); 9 


return input; 


auto divide point-std::partition(input.begin(),input.end(), 


[&] (T const& t) (return t<pivot;}); ^e 


Std::list«T» lower part; 
lower part.splice(lower part.end(),input,input.begin(), 


divide point); ^o 


auto new lower(í( 


sequential quick sortí(std::move(lower part))); -+ 人 © 
auto new higher( 

sequential quick sort(std::move(input))); -© 
result.splice(result.end(),new higher); —9 
result.splice(result.begin(),new lower); «Oo 


return result; 


尽管 接口 是 FP 风格 的 ， 如 果 你 自始至终 使 用 FP 风格 ， 就 会 制作 很 多 的 副本 ， 
即 你 在 内 部 使 用 了 “标准 * 祈 使 风格 。 取 出 第 一 个 元 素 作为 中 轴 ， 方 法 是 
用 splice()@ 将 其 从 列表 前 端 切 下 。 虽 然 这 样 可 能 会 导致 一 个 次 优 排 序 〈( 考 虑 到 
比较 和 交换 的 次 数 ) ， 由 于 列表 遍历 的 缘故 ， 用 std: :1ist 做 任何 其 他 事 都 可 能 
增加 很 多 的 时 间 。 你 已 知 要 在 结果 中 得 到 它 ， 因 此 可 以 直接 将 其 拼接 至 将 要 使 用 
的 列表 中 。 现 在 ， 你 还 会 想 要 将 其 作 比 较 ， 因 此 让 我 们 对 它 进行 引用 ， 以 避免 复 
制 @。 接 着 可 以 使 用 std: :partition 将 序列 划分 成 小 于 中 轴 的 值 和 不 小 于 中 轴 
的 值 @。 指 定 划分 依据 的 最 简单 方式 是 使 用 一 个 lambda 函 数 ， 使 用 引用 捕获 以 避 
人 免 复制 pivot 的 值 ( 参 见 附录 人 A 中 A.5 节 更 多 地 了 解 lambda 函 数 ) 。 

std: :partition() 就 地 重新 排列 列表 ， 并 返回 一 个 迭代 器 ， 它 标记 着 第 一 
个 不 小 于 中 轴 值 的 元 素 。 和 迭代 器 的 完整 类 型 可 能 相当 宛 长 ， 因 此 可 以 使 用 auto 类 
型 说 明 符 ， 使 得 编译 器 帮 你 解决 “参见 附录 A 中 A.7 节 ) 。 


现在 ， 你 已 经 选择 了 FP 风格 接口 ， 因 此 如 果 打 算 使 用 递归 来 排序 这 两 “ 半 ”， 


则 需要 创建 两 个 列表 。 可 以 通过 再 次 使 用 splice() 将 从 input 到 divide point 
的 值 移动 至 一 个 新 的 列表 : lower_part@@。 这 使 得 input 中 只 仅 留 下 剩余 的 值 。 
你 可 以 接着 用 递归 调用 对 这 两 个 列表 进行 排序 人 @、@@。 通 过 使 用 std: :move() 传 
入 列表 ， 也 可 以 在 此 处 避免 复制 一 一 但 是 结果 也 将 被 隐 式 地 移动 出 来 。 最 后 ， 你 
可 以 再 次 使 用 splice() 将 result 以 正确 的 顺序 连 起 来 。new_higher 值 在 中 轴 之 
后 直到 末尾 @， 而 new_lower 值 从 开始 起 ， 直 到 中 轴 之 前 。 


2. FP 风格 并 行 快速 排序 

由 于 已 经 使 用 了 函数 式 风 格 ， 通 过 future 将 其 转换 成 并 行 版 本 就 很 容易 了 ， 如 
清单 4.13 所 示 。 这 组 操作 与 之 前 相同 ， 区 别 在 于 其 中 一 部 分 现在 并 行 地 运行 。 此 
版 本 使 用 future 和 函数 式 风格 实现 快速 排序 算法 。 


清单 4.13 ”使 用 future 的 并 行 快速 排序 


template<typename T> 
std::list«T» parallel quick sortí(std::list«T» input) 
{ 

if (input .empty () ) 


{ 
} 


std::list<T> result; 
result.splice (result .begin(),input,input.begin({)); 
T const& pivot=*result .begin{); 


return input; 


auto divide point-std::partition(input.begin(),input.end(), 
[&] (T const& t) (return t<pivot;}); 


std::list<T> lower part; 
lower part.splice (lower part.end(),input,input.begin(), 


divide point); 
std: :future<std::list<T> > new loweri E 


std: :async(&parallel quick sort«T»,std::move(lower part))); 
auto new higher( 
parallel quick sort (std::move(input))); a9 


result.splice(result.end(),new higher); 
result .splice (result .begin(),new_lower.get()); «D 
return result; 


这 里 最 大 的 变化 是 ， 没 有 在 当前 线程 中 对 较 小 的 部 分 进行 排序 ， 而 是 在 另 一 
个 线程 中 使 用 std: :async() 对 其 进行 排序 @。 列 表 的 上 部 分 跟 之 前 一 样 直 接 递 
归 @ 进 行 排序 。 通 过 递归 调用 parallel quick_sort()， 你 可 以 充分 利用 现 有 
的 硬件 并 发 能 力 。 如 果 std: :async() 每 次 启动 一 个 新 的 线程 ， 那 么 如 果 你 占 下 
递归 三 次 ， 就 会 有 8 个 线程 在 运行 ， 如 果 癌 下 递归 10 次 (对 大 约 1000 个 元 素 〉， 
如 果 人 硬件 可 以 处 理 的 话 ， 就 将 有 1024 个 线程 在 运行 。 如 果 类 库 认 定 产 生 了 过 多 的 
任务 《也许 是 因为 任务 的 数量 超过 了 可 用 的 硬件 并 发 能 力 ) ， 则 可 能 改 为 同步 地 
产生 新 任务 。 他 们 会 在 调用 get( ) 的 线程 中 运行 ， 而 不 是 在 新 的 线程 中 ， 从 而 避 
免 在 不 利于 性 能 的 情况 下 把 任务 传递 到 另 一 个 线程 的 开销 。 值 得 注意 的 是 ， 对 于 
std: :async 的 实现 来 说 ， 只 有 显 式 指定 了 std: :launch: :deferred 再 为 每 一 个 
任务 开启 一 个 新 线程 (甚至 在 面 对 大 量 的 过 度 订 阅 时 ) ， 或 是 只 有 显 式 指定 了 
std: :launch::async 再 同步 运行 所 有 任务 ， 才 是 完全 符合 的 。 如 果 依 靠 类 库 进 
E 建议 你 查阅 一 下 这 一 实现 的 文档 ， 看 一 看 它 究竟 表现 出 什么 样 的 行 


与 其 使 用 std: :async()， 不 如 自行 编写 spawn_task() 函 数 作 

为 std: :packaged task 和 std: :thread 的 简单 封装 ， 如 清单 4.14 所 示 ， 为 函数 
调用 结果 创建 了 一 个 std: :packaged _ task， 从 中 获取 future， 在 线程 中 运行 之 并 
返回 future。 其 本 身 并 不 会 带 来 多 少 优点 《实际 上 可 能 导致 大 量 的 过 度 订 阅 ) ， 但 
它 为 迁移 到 一 个 更 复杂 的 实现 做 好 准备 ， 它 通过 一 个 工作 线程 池 ， 将 任务 添加 到 
一 个 即将 运行 的 队列 里 。 我 们 会 在 第 9 章 研 究 线 程 池 。 相 比 于 使 用 std: :async， 
只 有 在 你 确实 知道 将 要 做 什么 ， 并 且 和 希望 想 要 通过 线程 池 建 立 的 方式 进行 完全 掌 
控 和 执行 任务 的 时 候 ， 才 值得 首选 这 种 方法 。 


总 之 ， 回 到 parallel_quick_sort。 因 为 只 是 使 用 直接 递归 获取 
new_higher， 你 可 以 将 其 拼接 到 之 前 的 位 置 @。 但 是 现在 new_lower 
是 std: :futurex<std::1ist<T>> 而 不 仅 是 列表 ， 因 此 需要 在 调用 splice() 之 前 
调用 get() 来 获取 值 人 @。 这 就 会 等 待 后 台 任 务 完成 ， 并 将 结果 移动 至 splice( ) 调 
H; get() 返 回 一 个 引用 了 所 包含 结果 的 右 值 ， 所 以 它 可 以 被 移 除 ( 参 见 附录 A 
中 A.1.1 节 更 多 地 了 解 右 值 引 用 和 移动 语义 ) 。 


即使 假设 std: :async() 对 可 用 的 硬件 并 发 能 力 进行 最 优化 的 使 用 ， 这 仍 不 
是 快速 排序 的 理想 并 行 实现 。 原 因 之 一 是 ，std: :partition 完 成 了 很 多 工作 ， 
且 仍 为 一 个 连续 调用 ， 但 对 于 目前 已 经 足够 好 了 。 如 果 你 对 最 快 可 能 的 并 行 实现 
有 兴趣 ， 请 查阅 学 术 文 献 。 


清单 4.14 一 个 简单 spawn_task 的 实现 


template<typename F,typename A> 
std: :future<std: :result_of<F (A&&) >: :type> 
spawn task(F&& f,A&& a) 


{ 
typedef std::result of<F{(A&&)>::type result type; 
std::packaged task<result_type (A&&) > 

taskí(std::move(£))); 

std::future«result type» res(task.get future()); 
std::thread tí(std::move(task),std: :move (a) ) ; 
t.detach{); 
return res; 

} 


函数 式 编 程 并 不 是 唯一 的 避 开 共享 可 变数 据 的 并 发 编程 范式 ; 另 一 种 范式 为 
CSP (Communicating Sequential Process， 通 信 顺 序 处 理 ) Sl， 这 种 范式 下 线程 在 
概念 上 完全 独立 ， 没 有 共享 数据 ， 但 是 具有 人 允许 消息 在 它们 之 间 进 行 传递 的 通信 
通道 。 这 是 被 编程 语言 Erlang Chttp://www.erlang.org/) 所 采用 的 范式 ， 也 通常 被 
MPI (Message Passing Interface， 消 息 传 递 接 口 ) 〈http:/www.mpi-forum.org/) 环 
境 用 于 C 和 C++ 中 的 高 性 能 计算 。 我 可 以 肯定 到 目前 为 止 ， 你 不 会 对 这 在 C++ 中 也 
ee 
方式 。 


4.4.2 ”具有 消息 传递 的 同步 操作 


CSP 的 思想 很 简单 :如 果 没 有 共享 数据 ， 则 每 一 个 线程 可 以 完全 独立 地 推理 
得 到 ， 只 需 基 于 它 对 所 接收 到 的 消 轧 如 何 进行 反应 。 因 此 每 个 线程 实际 上 可 以 等 
效 为 一 个 状态 机 : 当 它 接收 到 消息 时 ， 它 会 根据 初始 状态 进行 操作 ， 并 以 茶 种 方 
式 更 新 其 状态 ， 并 可 能 回 其 他 线程 发 送 一 个 或 多 个 消 轧 。 编 写 这 种 线程 的 一 种 方 
式 ， 是 将 其 形式 化 并 实现 一 个 有 限 状 态 机 模型 ， 但 这 并 不 是 唯一 的 方式 。 状 态 机 
在 应 用 程序 结构 中 可 以 是 隐 式 的 。 在 任 一 给 定 的 情况 下 ， 完 竟 哪 种 方法 更 佳 ， 取 
决 于 具体 形势 的 行为 需求 和 编程 团队 的 专长 。 但 是 选择 实现 每 一 个 线程 ， 则 将 其 
分 割 成 独立 的 进程 可 能 会 从 共享 数据 并 发 中 移 除 很 多 复杂 性 ， 因 而 使 得 编程 更 加 
容易 ， 降 低 了 错误 率 。 


真正 的 通信 序列 进程 并 不 共享 数据 ， 所 有 的 通信 都 通过 消息 队列 ， 但 由 于 
C++ 线 程 共 享 一 个 地 址 空间 ， 因 此 不 可 能 强制 执行 这 一 需求 。 这 就 是 准则 介入 的 
地 方 。 作 为 应 用 程序 或 类 库 的 作者 ， 我 们 的 责任 是 确保 我 们 不 在 线程 间 共 享 数 
2 为 了 线程 之 间 的 通信 ， 消 息 队 列 必 须 是 共享 的 ， 但 是 其 细节 可 以 封装 
ER o 


想象 一 下 ， 你 正在 实现 ATM 的 代码 。 此 代码 需要 处 理 人 试图 取 钱 的 交互 和 与 
相关 银行 的 交互 ， 还 要 控制 物理 机 器 接受 此 人 的 卡片 ， 显 示 恰 当 的 信息 ， 处 理 按 
键 ， 出 钞 并 退回 用 户 的 卡片 。 


处 理 这 一 切 事情 的 其 中 一 种 方法 ， 是 将 代码 分 成 三 个 独立 的 线程 : 一 个 处 理 
物理 机 器 、 一 个 处 理 ATM 逐 辑 、 还 有 一 个 与 银行 进行 通信 。 这 些 线程 可 以 单纯 地 
通过 传递 消息 而 非 共 享 数据 进行 通信 。 例 如 ， 当 有 人 在 机 器 旁边 将 卡 插入 或 按 下 
按钮 时 ， 处 理 机 器 的 线程 可 以 发 送 消息 至 逻辑 线程 ， 同 时 逻辑 线程 将 发 送 消 息 至 
机 器 线程 ， 指 示 要 发 多 少 钱 等 等 。 


对 ATM 多 辑 进行 建 模 的 一 种 方式 ， 是 将 其 视 为 一 个 状态 机 。 在 每 种 状态 中 ， 
线程 等 待 可 接受 的 消息 ， 然 后 对 其 进行 处 理 。 这 样 可 能 会 转换 到 一 个 新 的 状态 ， 
并 且 循 环 继续 。 一 个 简单 实现 中 所 涉及 的 状态 如 图 4.3 押 示 。 在 这 个 简化 了 的 实现 
中 ， 系 统 等 待 卡片 插 入 。 一 旦 卡片 插入 ， 便 等 竺 用户 输入 其 密码 ， 每 次 一 个 数 
字 。 他 们 可 以 删除 最 后 输入 的 数字 。 一 旦 输入 的 数字 足够 多 ， 就 验证 密码 。 如 果 
密码 错误 ， 则 结束 ， 将 卡片 退回 给 用 户 ， 并 继续 等 竺 有 人 插入 卡片 。 如 果 密 码 正 
确 ， 则 等 每 用 户 取消 交易 或 选择 取出 的 金额 。 如 果 用 户 取消 ， 则 结束 ， 并 退出 银 
行 卡 。 如 果 用 户 选 择 了 一 个 金额 ， 则 等 等 银 行 确认 后 发 放 现 金 并 退出 其 卡片 ， 或 
者 显示 “资金 不 足 ” 的 消息 并 退出 其 卡片 。 显 然 ， 真正 的 ATM 比 这 复杂 得 多 ， 但 这 
己 经 足以 阐述 整个 想法 。 
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按 下 数学 键 (最 后 一 位 ) 
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等 待 确认 


图 4.3 ATM 的 简单 状态 机 模型 
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有 了 ATM 逻 辑 的 状态 机 设计 之 后 ， 束 可 以 使 用 一 个 具有 表示 每 一 个 状态 的 成 
员 函 数 的 类 来 实现 之 。 每 一 个 成 员 函 数 都 可 以 等 待 指定 的 一 组 传 入 消息 ， 并 在 它 
们 到 达 后 进行 处 理 ， 其 中 可 能 触发 切换 到 另 一 状态 。 每 个 不 同 的 消息 类 型 可 以 由 
一 个 独立 的 struct 来 表示 。 清 单 4.15 展 示 了 这 样 一 个 系统 中 ATM 逻 辑 的 部 分 简单 
实现 ， 包 括 主 循环 和 第 一 个 状态 的 实现 ， 即 等 竺 卡片 插入 。 


如 你 所 见 ， 所 有 消息 传递 所 必需 的 同步 完全 隐藏 于 消息 传递 库 内 部 (其 基本 
实现 以 及 本 示例 的 完整 代码 见 附录 C) 。 


清单 4.15 ATMDE 8358 fi] HR. SICH 


struct card inserted 


{ 
hy 


class atm 


{ 


std::string account; 


messaging: :receiver incoming; 
messaging: :sender bank; 

messaging: :sender interface hardware; 
void (atm::*state) (}; 


std::string account; 
std::string pin; 


void waiting for card() 0 
{ 
interface hardware.send(display enter card()); -© 
incoming.wait () ^6 
-handle<card_inserteds ( 
[&] (card_inserted const& msg} «0 


{ 


account-msg.account; 
pins Wi, 
an r 


interface hardware.send{display enter pin{)}; 
State-&atm::getting pin; 


us 


j 
void getting pin(í); 
public: 
void run() «9 
{ 
state=&atm: :waiting for card; -© 
try 
{ 
for (;;) 
{ 
(this-»*state) 0; <+@ 
} 
} 
catch (messaging: : close queue const&) 
{ 
} 
j 


正如 已 经 提 到 的 ， 这 里 所 描述 的 实现 是 从 ATM 所 需 的 真正 逻辑 中 粗略 简化 而 
来 的 ， 但 这 确实 给 你 一 种 消息 传递 的 编程 风格 的 感受 。 没 有 必要 去 考虑 同步 和 并 
发 的 问题 ， 只 要 考虑 在 任意 一 个 给 定 的 店 ， 可 能 会 接收 到 哪些 消息 ， 以 及 该 发 送 
哪些 消息 。ATM 逮 辑 的 状态 机 在 单线 程 上 运行 ， 而 系统 的 其 他 部 分 ， 比 如 银行 的 
接口 和 终端 的 接口 ， 则 在 独立 的 线程 上 运行 。 这 种 程序 设计 风格 被 称 作 行为 角色 
模型 Cactormodel ) 系统 中 有 多 个 离散 的 角色 “〈 均 运行 在 独立 线程 上 ) ， 用 
来 相互 发 送 消息 以 完成 手头 任务 ， 除 了 直接 通过 消息 传递 的 状态 外 ， 没 有 任何 共 
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执行 是 由 run() 成 员 函 数 开 始 的 @， 设 置 初 始 状 态 为 waiting_for_card@ 
并 重复 执行 代表 当前 状态 (不 管 它 是 什么 的 成 员 函 数 @。 状 态 函 数 就 是 atm 类 
的 简单 成 员 函 数 。waiting_for_card 状 态 函 数 @ 也 很 简单 : 发 送 一 则 消息 至 界 
面 以 显示 “等 待 卡 片 ? 的 消息 介 ， 接 着 等 得 要 处 理 的 消息 。 这 里 能 处 理 的 唯一 消息 
类 型 是 card_inserted 消 息 @， 可 以 通过 lambda 函 数 进行 处 理 @。 你 可 以 将 任意 
函数 或 函数 对 象 传 递 给 handle 函 数 ， 但 是 像 这 种 简单 的 情况 ， 用 lambda 是 最 容易 
的 。 注 意 handle( ) 函 数 调用 是 链接 至 wait( ) 函 数 的 。 如 果 接 收 到 的 消息 不 匹配 
指定 的 类 型 ， 它 将 被 丢弃 ， 线 程 将 继续 等 待 直至 接收 到 匹配 的 消息 。 


lambda 函 数 本 号 只 是 将 卡片 中 的 账户 号 码 缓存 至 一 个 成 员 变 量 中 ， 清 除 当前 
密码 ， 发 送 消息 给 接口 硬件 以 显示 要 求 用 户 输入 其 密码 ， 改 为 “获取 密码 ”状态 。 


一 旦 消息 处 理 程序 完成 ， 状 态 函 数 即 返回 ， 同 时 主 循环 调用 新 的 状态 函数 @。 


getting_pin 状 态 函 数 略 有 些 复杂 ， 它 可 以 处 理 三 种 不 同类 型 的 消息 ， 如 图 
4.3 所 示 。 由 清单 4.16 加 以 展示 。 


清单 4.16 简单 ATM 实 现 的 getting_pin 状 态 函 数 


void atm: :getting piní) 


{ 
incoming.wait (} 
.handle«digit pressed»( 0 
[&] (digit_pressed const& msg) 
{ 
unsigned const pin _length=4; 
pin«-msg.digit; 
if(pin.lengthí()zzpin length) 
bank.send(verify pin(account,pin,incoming)); 
state-&atm::verifying pin; 
j 
} 
| aT 
.handle«clear last pressed»( 
[&] (Clear last pressed const& msg) 
{ 
if(!pin.empty () ) 
{ 
pin.resize(pin.length()-1); 
j 
} 
! Pa 
.handle«cancel pressed> ( 
[&] (cancel pressed const& msg) 
{ 
state=&atm: :done processing; 
} 
LE 
} 


这 时 ， 有 三 种 能 够 处 理 的 消息 类 型 ， 所 以 wait() 函 数 有 三 个 handle( ) 调 用 
链接 至 结尾 @、@、 合 。 每 一 次 对 handle() 的 调用 将 消息 类 型 指定 为 模板 参数 ， 
然后 传 至 接受 该 特定 消息 类 型 作为 参数 的 lambda 函 数 。 由 于 调用 通过 这 种 方式 链 
接 起 来 ，wait( ) 的 实现 知道 它 正在 等 待 一 个 digit_pressed 消 


息 、clear_last_pressed 消 息 或 是 cancel_pressed 消 息 。 任 何其 他 类 型 的 消 
恩 将 再 次 被 丢弃 。 

这 时 ， 在 获取 消息 之 后 你 并 不 一 定 非 要 改变 状态 。 例 如 ， 如 果 你 得 到 了 一 
个 digit_pressed 消 息 ， 仅 需 将 它 添加 至 pin， 除 非 它 为 最 后 的 数字 。 清 单 4.15 
中 的 主 循环 @ 将 再 次 调用 getting_pin() 来 等 待 下 一 个 数字 (或 是 清除 或 取 
Was 

这 对 应 于 图 4.3 所 示 的 行为 。 每 一 个 状态 框 通过 不 同 的 成 员 函 数 来 实现 ， 它 们 
等 待 相关 的 消息 并 适当 地 更 新 状态 。 

如 你 所 见 ， 这 种 编程 风格 可 以 大 大 简化 设计 并 发 系统 的 任务 ， 因 为 每 个 线程 
可 以 完全 独立 地 对 待 。 这 就 是 使 用 多 线程 来 划分 关注 点 的 一 个 例子 ， 并 且 需 要 你 
明确 决定 如 何在 线程 间 划 分 任务 。 


4.5 ”小 结 


线程 间 的 同步 操作 ， 是 编写 一 个 使 用 并 发 的 应 用 程序 的 重要 组 成 部 分 。 如 果 
没有 同步 ， 那 么 线程 本 质 上 是 独立 的 ， 就 可 以 被 写作 独立 的 应 用 程序 ， 由 于 它们 
之 间 存 在 相关 活动 而 作为 群 组 运行 。 在 本 章 中 ， 我 介绍 了 同步 操作 的 各 种 方式 ， 
从 最 基本 条 件 变 量 ， 到 future、promise 以 及 打包 任务 。 我 还 讨论 了 解决 同步 问题 
的 方式 ， 函 数 式 编程 ， 其 中 每 个 任务 产生 的 结果 完全 依赖 于 它 的 输入 而 不 是 外 部 
环境 ， 以 及 消息 传递 ， 其 中 线程 则 的 通信 是 通过 一 个 扮演 中 介 和 角色 的 消息 子 系统 
发 送 异 步 消 息 来 实现 的 。 


我 们 已 经 讨论 了 许多 在 C++ 中 可 用 的 高 阶 工具 ， 现 在 是 时 候 来 看 看 令 这 一 切 
得 以 运转 的 底层 工具 了 : C++ 内 存 模型 和 原子 操作 。 


[1] 在 The Hitchhiker's Guide to the Galaxy 一 书 中 ， 计 算 机 Deep Thought 被 建造 是 用 
于 决定 “生命 、 宇 宙 和 万 物 的 答案 ”。 答 案 是 42。 


[2] Æ Whttp://www.haskell.org/. 


[3] Communicating Sequential Processes, C.A.R. Hoare, Prentice Hall, 1985. Available 
free online at http://www.usingcsp.com/cspbook.pdf 


"hok C++ 内 和 存 模 型 和 原子 类 型 上 操作 


本 章 主 要 内 容 


C++11 内 存 模型 的 详情 

由 C++ 标准 库 提 供 的 原子 类 型 

这 些 类 型 上 可 用 的 操作 

如 何 使 用 那些 操作 提供 线程 间 的 同步 


C++11 标 准 中 最 重要 的 特性 之 一 ， 是 大 多 数 程序 员 甚至 都 不 会 关注 的 东西 。 
它 并 不 是 新 的 语法 特性 ， 也 不 是 新 的 类 库 功 能 ， 而 是 新 的 多 线程 感知 内 存 模 型 。 
在 是 没有 内 存 模型 来 严格 定义 基本 构造 模块 如 何 工 作 ， 我 所 介绍 的 功能 束 不 能 6 
靠 地 工作 。 当 然 ， 大 多 数 程序 员 没 有 注意 到 它 是 有 原因 的 。 如 果 使 用 互 斥 元 来 保 
护 数 据 ， 以 及 条 件 变 量 或 者 future 作 为 事件 信和 号， 它们 为 何 工 作 的 细节 就 不 重要 
了 。 仪 当 你 开始 尝试 “接近 机 器 * 时 ， 内 存 模型 的 精确 细节 才 重 要 。 


无 论 其 他 语言 如 何 ，C++ 是 一 门 系统 编程 语言 。 标 准 委员 会 的 目标 之 一 ， 是 
不 再 需要 一 个 比 C++ 更 低级 的 语言 。 应 该 在 C++ 里 为 程序 员 提 供 足 够 的 灵活 性 ， 
在 做 任何 他 们 需要 的 事情 时 不 会 被 语言 挡 在 路 中 间 ， 并 且 在 提出 需求 时 允许 他 
们 “接近 机 器 *。 原 子 类 型 和 操作 正 是 要 允许 这 一 点 ， 提 供 了 可 通常 减 至 一 或 两 个 
CPU 指 令 的 低 阶 同步 操作 的 功能 。 

在 本 章 中 ， 我 将 从 阐述 内 存 模型 的 基础 开始 ， 接 着 转 到 原子 类 型 和 操作 ， 并 
最 终 介 绍 可 用 于 原子 类 型 上 操作 的 多 种 同步 类 型 。 这 是 相当 复杂 的 ， 除 非 你 打算 
使 用 原子 操作 编写 代码 以 实现 同步 《比如 第 7 章 中 的 无 锁 数 据 结构 ) ， 否 则 无 需 
知道 这 些 细节 。 


让 我 们 放 轻 松 ， 来 看 看 内 存 模型 的 基础 。 


5.1 ”内存 模型 基础 


内 存 模 型 包括 两 个 方面 : 基本 结构 方面 ， 这 与 事物 是 如 何 放置 在 内 存 中 的 有 
关 ; 然后 是 并 发 方面 。 结 构 方 面 对 于 并 发 是 很 重要 的 ， 尤 其 从 低级 原子 操作 中 来 
看 ， 因 此 我 将 从 这 里 开始 。 在 C++ 中 ， 一 切 都 是 关于 对 象 和 内 存 位 置 。 


5.11 对 象 和 内 存 位 置 


C++ 程 序 中 的 所 有 数据 均 是 由 对 象 (object〉 组 成 的 。 这 并 不 是 说 你 可 以 创 
建 一 个 派生 上 自 int 的 新 类 ， 或 是 基本 类 型 具有 成 员 函 数 ， 或 者 当 人 们 谈 及 如 
Smalltalk 或 Ruby 这 样 的 语言 ， 说 “一 切 都 是 对 象 " 时 暗 指 的 任何 其 他 结果 。 这 只 是 
一 句 关 于 C++ 中 数据 的 构造 块 的 一 种 陈述 。C++ 标 准 定义 对 象 为 "存储 区 域 ”， 尽 
管 它 会 为 这 些 对 象 分 配属 性 ， 如 它们 的 类 型 和 生存 期 。 


其 中 一 些 对 象 是 简单 基本 类 型 的 值 ， 如 int 或 float， 而 另 一 些 则 是 用 户 定 义 
类 的 实例 。 有 些 对 象 ( 例 如 数组 、 派 生 类 的 实例 和 具有 非 静 态 数据 成 员 类 的 实 
例 ) 具有 子 对 象 ， 但 其 他 的 则 没有 。 


无 论 什 么 类 型 ， 对 象 均 被 存储 于 一 个 或 多 个 内 存 位 置 中 。 每 个 这 样 的 内 存 位 
置 要 么 是 一 个 标量 类 型 的 对 象 〈 或 子 对 象 ) ， 比 如 unsigned short 
或 ny_class*， 要 么 是 相 邻 位 域 的 序列 。 如 果 使 用 位 域 ， 有 非常 重要 的 一 点 必须 
TER: 虽然 相 邻 的 位 域 是 不 同 的 对 象 ， 但 它们 仍然 算 作 相 同 的 内 存 位 置 。 图 5.1 表 
示 了 一 个 struct 如 何 划分 为 对 象 和 内 存 位 置 。 


首先 ， 整 个 struct 是 一 个 对 象 ， 它 由 几 个 子 对 象 组 成 ， 各 子 对 象 对 应 每 个 数 
据 成 员 。 位 域 bfl1 和 bf2 共 享 一 个 内 存 位置 ， 而 std: :string 对 象 在 内 部 由 几 个 内 
存 位 置 组 成 ， 但 是 其 余 的 每 个 成 员 都 有 自己 的 内 存 位 置 。 注 意 零 长 度 的 位 域 bf3 
是 如 何 将 bf4 分 割 进 它 自己 的 内 存 位 置 的 。 


可 以 从 中 汲取 四 个 要 点 。 


每 个 变量 都 是 一 个 对 象 ， 包 括 其 他 对 象 的 成 员 。 

每 个 对 象 占据 至 少 一 个 内 存 位 置 。 

如 int 或 char 这 样 的 基本 类 型 的 变量 恰好 一 个 内 存 位 置 ， 不 论 其 大 小 ， 即 便 
它们 相 邻 或 是 数组 的 一 部 分 。 

相 邻 的 位 域 是 相同 内 存 位 置 的 一 部 分 。 


我 可 以 肯定 你 在 怀疑 这 与 并 发 有 什么 关系 ， 那 么 让 我 们 来 看 一 看 。 


内 存 位 置 


[ 
feel 
ETE] 
[seen] 
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图 5.1 将 struct 划 分 为 对 象 和 内 存 位 置 


5.1.2 对象 、 内 存 位 置 以 及 并 发 


好 了 ， 这 里 是 对 于 C++ 中 多 线程 应 用 程序 至 关 重 要 的 部 分 ， 所 有 东西 都 取决 
于 这 些 内 存 位 置 。 如 果 两 个 线程 访问 不 同 的 内 存 位 置 ， 是 没有 问题 的 ， 一 切 工作 
正常 。 男 一 方面 ， 如 果 两 个 线程 访问 相同 的 内 存 位 置 ， 那 么 你 就 得 小 心 了 。 如 果 
线程 都 没有 在 更 新 该 内 存 位 置 ， 没 问题 ， 只 读数 据 不 需要 进行 保护 或 同步 。 如 果 
任意 一 个 线程 正 修改 数据 ， 就 会 有 竞争 条 件 的 可 能 ， 如 第 3 章 所 述 。 


为 了 避免 竞争 条 件 ， 在 这 两 个 线程 的 访问 中 间 ， 就 必须 有 一 个 强制 的 顺序 。 
确保 有 一 个 确定 顺序 的 方法 之 一 ， 是 使 用 如 第 3 章 中 所 述 的 互 斥 元 。 如 果 同 一 个 
互 太 元 在 两 个 访问 之 前 被 锁定 ， 则 每 次 只 有 一 个 线程 可 以 访问 该 内 存 位 置 ， 即 有 
一 个 必然 发 生 在 男 一 个 之 前 。 男 一 种 方法 是 在 相同 的 或 是 其 他 的 内 存 位 置 使 用 原 
T (atomic) 操作 的 同步 特性 (参见 5.2 节 对 原子 操作 的 定义 )， 在 两 个 线程 的 访 
问 之 间 强 加 一 个 顺序 。 用 原子 操作 来 强制 顺序 描述 于 5.3 节 。 如 果 多 于 两 个 线程 访 
问 同一 个 内 存 位 置 ， 则 每 一 对 访问 都 必须 具有 明确 的 顺序 。 


如 果 来 自 独 立 线 程 的 两 个 对 同一 内 存 位 置 的 访问 没有 强制 顺序 ， 其 中 一 个 或 


两 个 访问 不 是 原子 的 ， 且 一 个 或 两 个 是 写 操作 ， 那 么 这 就 是 数据 竞 争 并 导致 玉 定 
义 行为 。 


这 个 陈述 是 至 关 重 要 的 : 未 定义 行为 是 C++ 最 令 人 不 更 的 状况 之 一 。 根 据 语 
言 标准 ， 一 旦 应 用 程序 包含 未 定义 行为 ， 那 么 一 切 都 很 难说 ， 整 个 应 用 程序 的 行 
为 都 是 未 定义 的 ， 它 能 干 出 任何 事情 来 。 我 所 知道 的 一 个 情况 是 ， 某 个 未 定义 行 
为 的 实例 导致 茶 人 的 监视 占 着 火 了 。 虽 然 这 不 大 可 能 发 生 在 你 身上 ， 但 数据 竞争 
绝对 是 一 个 严重 的 错误 ， 且 应 该 不 惜 一 切 代价 来 避免 。 


在 该 陈述 中 ， 还 有 另外 一 个 很 重要 的 点 :可 以 通过 使 用 原子 操作 来 访问 具有 
竞争 的 内 存 位 置 ， 来 避免 不 确定 行为 。 这 并 不 阻止 竞争 本 身 一 一 原子 操作 所 接触 
的 内 存 位 置 首先 仍 是 未 指定 的 一 一 但 是 却 能 够 将 程序 带 回 确定 行为 的 领域 。 


* 在 学 习 原 子 操作 前 ， 还 有 一 个 对 了 解 对 象 与 内 存 位 置 很 重要 的 概念 : 修改 顺 
Fo 


5.1.3 ”修改 顺序 


C++ 程序 中 每 个 对 象 ， 都 具有 一 个 确定 的 修改 顺序 Gmodificationorder ) ， 
它 是 由 来 自 程序 中 的 所 有 线程 的 对 该 对 象 的 所 有 写 入 组 成 的 ， 由 对 象 的 初始 化 开 
始 。 在 多 数 情况 下 ， 该 顺序 在 每 次 运行 之 间 都 有 所 不 同 ， 但 是 在 任意 给 定 的 程序 
执行 里 ， 系 统 中 的 所 有 线程 必须 一 致 同意 此 顺序 。 如 果 问 题 中 的 对 象 不 是 如 5.2 节 
所 述 的 原子 类 型 之 一 ， 你 就 得 负责 确认 有 足够 的 同步 ， 来 确保 线程 一 致 同 意 每 个 
变量 的 修改 顺序 。 如 果 不 同 的 线程 看 到 的 是 一 个 变量 的 不 同 的 顺序 值 ， 就 会 有 数 
据 竞 争 和 未 定义 行为 〈 参 见 5.1.2 节 ) 。 如 果 使 用 原子 操作 ， 编 译 器 将 负责 确保 必 
要 的 同步 已 就 位 。 


这 一 要 求 意味 着 茶 些 投机 性 的 执行 是 禁止 的 ， 因 为 一 旦 线程 已 在 修改 顺序 中 
看 到 了 茶 个 特定 项 ， 则 后 续 读 取 操 作 必 须 返 回 更 晚 的 值 ， 同 时 来 自 该 线程 对 此 对 
象 后 续 的 写 入 操作 在 修改 顺序 中 也 必须 发 生得 更 晚 。 同 样 ， 在 同一 线程 中 ， 在 对 
象 的 写 操作 之 后 的 读 取 ， 就 必须 返回 要 么 写 入 的 值 ， 要 么 在 该 对 象 的 修改 顺序 中 
更 晚 发 生 的 另 一 个 值 。 尽 管 所 有 的 线程 都 必须 一 致 同意 程序 中 每 一 个 独立 对 象 的 
修改 顺序 ， 但 却 不 必 一 致 同意 不 同 对 象 上 操作 的 相对 顺序 。 参 见 5.3.3 节 更 多 地 了 
解 线程 间 的 操作 顺序 。 


那么 ， 是 什么 构成 了 原子 操作 ， 它 又 是 如 何 用 来 强制 顺序 的 ? 


5.2 C++ 中 的 原子 操作 及 类 型 


原子 操作 Catomicoperation) 是 一 个 不 可 分 割 的 操作 。 从 系统 中 的 任何 一 个 
线程 中 ， 你 都 无 法 观察 到 一 个 完成 到 一 半 的 这 种 操作 ， 它 要 么 做 完了 ， 要 么 就 没 
做 完 。 如 果 读 取 对 象 值 的 载 入 操作 是 原子 的 “atomic) ， 并 且 所 有 对 该 对 象 的 修 
改 也 都 是 原子 的 ， 那 么 这 个 载 入 操作 所 获取 到 的 要 么 是 对 象 的 初始 值 ， 要 么 是 被 
东 个 修改 者 存储 后 的 值 。 


其 对 立 面 ， 是 一 个 非 原子 操作 可 能 被 另 一 个 线程 视 为 半 完 成 的 。 如 果 这 是 一 
次 存储 操作 ， 那 么 被 另 一 个 线程 观察 到 的 值 可 能 既 不 是 储存 前 的 值 也 不 是 已 存储 
的 值 ， 而 是 其 他 的 东西 。 如 果 执 行 非 原子 的 载 入 操作 ， 那 么 它 可 能 获取 对 象 的 一 
部 分 ， 由 男 一 个 线程 修改 了 值 ， 然 后 再 获取 其 余 的 对 象 ， 这 样 获 取 到 的 既 不 是 第 
一 个 值 也 不 是 第 二 个 值 ， 而 是 两 者 的 茶 种 组 合 。 这 就 是 一 个 简单 的 有 问题 的 竞争 
条 件 ， 正 如 第 3 章 所 述 的 那样 ， 但 是 在 这 个 级 别 ， 它 可 能 构成 一 个 数据 范 争 ( 参 
见 5.1 节 )〉 并 因而 导致 未 定义 行为 。 


Z 在 C++ 中 ， 大 多 数 情 况 下 需要 通过 原子 类 型 来 得 到 原子 操作 ， 让 我 们 来 看 一 


5.2.1 标准 原子 类 型 


标准 原子 类 型 可 以 在 <atomic> 头 文件 中 找到 。 在 这 种 类 型 上 的 所 有 操作 都 
是 原子 的 ， 在 语言 定义 的 意义 上 说 ， 只 有 在 这 些 类 型 上 的 操作 是 原子 的 ， 虽 然 你 
可 以 利用 互 斥 元 使 得 其 他 操作 看 起 来 像 原子 的 。 事 实 上 ， 标 准 原 子 类 型 本 身 就 可 
以 进行 这 样 的 模拟 ， 它 们 (几乎) 都 具有 一 个 is_lock_free() 成 员 函 数 ， 让 用 
户 决定 在 给 定 类 型 上 的 操作 是 否 直接 用 原子 指令 完成 (x.is_lock_free() 返 回 
true) ， 或 者 通过 使 用 编译 器 和 类 库 内 部 的 锁 来 完成 Cx. is_lock_free()i& [Fl 
false) 。 


唯一 不 提供 is_lock free() 成 员 函 数 的 类 型 是 std: :atomic fl1ag。 该 类 
型 是 一 个 非常 简单 的 布尔 标识 ， 并 且 在 这 个 类 型 上 的 操作 要 求 是 无 锁 的 。 一 旦 你 
有 了 一 个 简单 的 无 锁 布 尔 标志 ， 就 可 以 用 它 来 实现 一 个 简单 的 锁 ， 从 而 以 此 为 基 
础 实现 所 有 其 他 的 原子 类 型 。 当 我 说 非常 简单 时 ， 指 的 是 ， 类 型 
为 std: :atomic flag 的 对 象 被 初始 化 为 清除 ， 接 下 来 ， 它 们 可 以 被 查询 和 设置 
《通过 test_and_set() 成 员 函 数 ) 或 者 清除 〈 通 过 clear() 成 员 函 数 ) 。 就 是 
没有 赋值 ， 没 有 拷贝 构造 函数 ， 没 有 测试 和 清除 ， 也 没有 任何 其 他 的 操 


其 余 的 原子 类 型 全 都 是 通过 std: :atomic<> 类 模板 的 特 化 来 访问 的 ， 并 且 有 
一 点 更 加 的 全 功能 ， 但 可 能 不 是 无 锁 的 〈 如 前 所 述 ) 。 在 大 多 数 流行 的 平台 上 ， 


我 们 认为 内 置 类 型 的 原子 变种 (例如 std: :atomic<int> 和 
std::atomic«void*») 确实 是 无 锁 的 ， 但 却 并 非 是 要 求 的 。 你 马上 会 看 到 ， 
个 特 化 的 接口 反映 了 类 型 的 属性 。 例 如 ， 像 &= 这 样 的 位 操作 没有 为 普通 指针 作 定 
义 ， 因 此 它们 也 没有 为 原子 指针 作 定 义 。 


除了 可 以 直接 使 用 std: :atomic<>， 你 还 可 以 使 用 表 5.1 所 示 的 一 组 名 称 ， 来 


提 及 已 经 提供 实现 的 原子 类 型 。 


些 蔡 代 类 型 名 称 可 能 指 的 是 相 
类 。 在 同一 个 程序 中 混用 这 些 
会 因此 导致 不 可 移植 的 代码 。 


鉴于 原子 类 型 如 何 被 添加 到 C++ 标准 的 历史 ， 这 


应 的 std: :atomic<> 特 化 ， 也 可 能 是 该 特 化 的 基 
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替代 名 称 和 std: :atomic<> 特 化 的 直接 命名 ， 可 能 


表 5.1 标准 原子 类 型 的 替代 名 称 和 它们 所 对 应 的 std::atomic<> 特 化 


atomic_bool 


atomic_char 


atomic_schar 


atomic_uchar 


atomic_int 


atomic_uint 


atomic_short 


atomic_ushort 


atomic_long 


atomic_ulong 


atomic_llong 


对 应 的 特 化 


std::atomic<bool> 


std::atomic<char> 


std::atomic<signed char> 


std::atomic<unsigned char> 


std::atomic<int> 


std::atomic<unsigned> 


std::atomic<short> 


std::atomic<unsigned short> 


std::atomic<long> 


std::atomic<unsigned long> 


std::atomic<long long> 


atomic_ullong 


atomic_char16_t 


atomic_char32_t 


atomic_wchar_t 


std::atomic<unsigned long long> 


std::atomic<char16_t> 


std::atomic«char32 t» 


std::atomic«wchar. t» 


同 基本 原子 类 型 一 样 ，C++ 标 准 库 也 为 原子 类 型 提供 了 一 组 typedef， 对 应 
于 各 种 像 std: :size_t 这 样 的 非 原 子 的 标准 库 typedef， 如 表 5.2 所 示 。 


表 5.2 标准 库 原子 类 型 定义 以 及 其 对 应 的 内 置 类 型 定义 


原子 typedef 


对 应 的 标准 库 typedef 


atomic int least8 t 
atomic uint least8 t 
atomic int least16 t 
atomic uint least16 t 
atomic int least32 t 
atomic uint least32 t 
atomic int least64 t 
atomic uint least64 t 
atomic int fast8 t 
atomic uint fast8 t 
atomic int fast16 t 
atomic uint fast16 t 
atomic int fast32 t 
atomic uint fast32 t 
atomic int fast64 t 
atomic uint fast64 t 
atomic intptr t 
atomic uintptr t 
atomic size t 

atomic ptrdiff t 
atomic intmax t 
atomic uintmax t 


int least8 t 
uint least8 t 
int least16 t 
uint least16 t 
int least32 t 
uint least32 t 
int least64 t 
uint least64 t 
int fast8 t 
uint fast8 t 
int fast16 t 
uint fast16 t 
int fast32 t 
uint fast32 t 
int fast64 t 
uint fast64 t 
intptr t 
uintptr t 
size t 
ptrdiff t 
intmax t 
uintmax t 


好 多 的 类 型 啊 ! 有 一 个 很 简单 的 模式 ， 对 于 标准 的 typedef T， 其 对 应 的 原 


子 类 型 与 之 同名 并 带 有 atomic 前 
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atomic _T。 这 同样 适用 于 内 置 


类 型 ， 


DX] 


是 signed 缩 写 为 s，unsigned 缩 写 为 u，1long long 缩 写 为 llong。 一 般 来 说 ， 
无 论 你 要 使 用 的 是 什么 T， 都 只 是 简单 地 说 std: :atomic<T>， 而 不 是 使 用 蔡 代 名 


称 。 


传统 意义 上 ， 标 准 原子 类 型 是 不 可 复制 且 不 可 赋值 的 ， 因 为 它们 没有 拷贝 构 
造 函 数 和 拷贝 赋值 运算 符 。 但 是 ， 它 们 确实 支持 从 相应 的 内 置 类 型 的 赋值 进行 隐 
式 转换 并 赋值 ， 与 直接 load() 和 store() 成 员 函 
数 、exchange()、compare_exchange_weak() 以 及 
compare_exchange_strong() 一 样 。 它 们 在 适当 的 地 方 还 支持 复合 赋值 运算 
符 : +=、-=、*=、|= 等 ， 同 时 整 型 和 针对 指针 的 std: :atomic<> 特 化 还 支 
持 ++ 和 --。 这 些 运 算 符 也 拥有 相应 命名 的 具有 相同 功能 的 成 员 函 
数 : fetch_add()、fetch_or() 等 。 赋 值 运算 和 成 员 函 数 的 返回 值 既 可 以 是 存 
储 的 值 〈 在 赋值 运算 符 的 情况 下 ) 或 运算 之 前 的 值 〈 在 命名 函数 的 情况 下 ) 。 这 
避免 了 可 能 出 现 的 问题 ， 这 些 问 题 源 于 这 种 赋值 运算 符 通 常会 返回 一 个 将 要 赋值 
的 对 象 的 引用 。 为 了 从 这 种 引用 中 获取 存储 的 值 ， 代 码 就 得 执行 独立 的 读 操 作 ， 
这 就 允许 另 一 个 线程 在 赋值 运算 和 读 操作 之 间 修 改 其 值 ， 并 为 竞争 条 件 敞开 大 
门 。 


然而 ，std: : atomic<> 类 模板 并 不 仅仅 是 一 组 特 化 。 它 具有 一 个 主 模板 ， 可 
以 用 于 创建 一 个 用 户 定 义 类 型 的 原子 变种 。 由 于 它 是 一 个 泛 型 类 模板 ， 操 作 只 限 
为 1oad()、store() 〈 和 与 用 户 定义 类 型 间 的 相互 赋 
值 ) 、exchange()、compare_exchange_weak() 和 
compare_exchange_strong(). 


在 原子 类 型 上 的 每 一 个 操作 均 具 有 一 个 可 选 的 内 存 顺序 参数 ， 它 可 以 用 来 指 
定 所 需 的 内 存 顺序 语义 。 内 存 顺序 选项 的 确切 语义 参见 5.3 节 。 就 目前 而 言 ， 了 解 
运算 分 为 三 种 类 型 就 足够 了 。 


。 fff (store) 操作 ， 可 以 包括 

memory order relaxed. memory order release 
&kmemory order seq cst/Jlji 

载 入 Coad) 操作 ， 可 以 包括 
memory order relaxed. memory order consume. memory order acqui 
&kmemory order seq cst/Jlji 

读 - 修 改 - 写 C(read-modify-write) 操作， 可 以 包括 
memory order relaxed. memory order consume, 
memory order acquire. 

memory order release. memory order acq rel 
&kmemory order seq cst/Jlji 


所 有 操作 的 默认 顺序 为 nemory_order_seq_cst。 


现在 让 我 们 来 看 看 能 够 在 标准 原子 类 型 上 进行 的 实际 操作 ， 从 
std::atomic _ flag 开始。 


5.2.2 std::atomic_flag 上 的 操作 


std::atomic fl1ag 是 最 简单 的 标准 原子 类 型 ， 它 代表 一 个 布尔 标志 。 这 一 
类 型 的 对 象 可 以 是 两 种 状态 之 一 : 设置 或 清除 。 这 是 故意 为 之 的 基础 ， 仅 仅 是 为 
了 用 作 构 造 块 。 基 于 此 ， 除 非 在 极 特殊 情况 下 ， 否 则 我 都 不 希望 看 到 使 用 它 。 即 
ee EC pent ene 因为 它 展示 了 一 些 应 用 于 原子 类 型 
通用 策略 。 


类 型 为 std: :atomic_ flag 的 对 象 必须 用 ATOMIC_FLAG_INIT 初 始 化 。 这 会 
将 该 标志 初始 化 为 清除 状态 。 在 这 里 没有 其 他 的 选择 ， 此 标志 总 是 以 清除 开始 。 


std::atomic flag f=ATOMIC FLAG INIT; 


这 适用 于 所 有 对 象 被 声明 的 地 方 ， 且 无 论 其 具有 什么 作用 域 。 这 是 唯一 需要 
针对 初始 化 进行 特殊 处 理 的 原子 类 型 ， 但 同时 也 是 唯一 保证 无 锁 的 类 型 。 如 果 
std: :atomic_fl1ag 对 象 具有 状态 存储 持续 时 间 ， 那 么 就 保证 了 静态 初始 化 ， 这 
意味 着 不 存在 初始 化 顺序 问题 ， 它 总 是 在 该 标识 上 的 首次 操作 时 进行 初始 化 。 


一 旦 标识 对 象 初始 化 完成 ， 你 只 能 对 它 做 三 件 事 : 销毁 、 清 除 或 设置 并 查询 
其 先前 的 值 。 这 些 分 别 对 应 于 析 构 函数 、clear() 成 员 函 数 以 及 
test_and_set() 成 员 函 数 。clear() 和 test_and_set() 成 员 函 数 都 可 以 指定 一 
个 内 存 顺序 。clear() 是 一 个 存储 操作 ， 因 此 不 能 有 memory_order_acquire 
或 memory_order_acq_rel 语 义 ， 但 是 test_and_set() 是 一 个 读 -修改 - 写 操作 ， 
并 因此 能 够 适用 任意 的 内 存 顺 序 标签 。 至 于 每 个 原子 操作 ， 其 默认 值 都 


jémemory order seq cst. fl, 


toclear(std::memory order release) ; 0 
bool x-f.test and set({); O 


此 处 ， 对 clear() 的 调用 @@ 明 确 要 求 使 用 释放 语义 清除 该 标志 ， 而 对 
test_and_set() 的 调用 人 使 用 默认 内 存 顺序 来 设置 标志 和 获取 旧 的 值 。 


你 不 能 从 一 个 std: :atomic_flag 对 象 拷贝 构造 男 一 个 对 象 ， 也 不 能 将 一 
个 std: :atomic_ flag 赋 值 给 另外 一 个 。 这 并 不 是 std: :atomic_flag 特 有 的 ， 
而 是 所 有 原子 类 型 共有 的 。 在 原子 类 型 上 的 操作 全 都 定义 为 原子 的 ， 以 及 包括 两 
个 对 象 的 赋值 和 拷贝 构造 。 在 两 个 不 同 对 象 上 的 单一 操作 不 可 能 是 原子 的 。 在 拷 
贝 构造 或 拷贝 赋值 的 情况 下 ， 其 值 必 须 先 从 一 个 对 象 读 取 ， 再 写 入 另外 一 个 。 这 
oo 上 的 独立 操作 ， 其 组 合 不 可 能 是 原子 的 。 因 此 ， 这 些 操作 是 梦 


有 限 的 特性 集 使 得 std: atomic flag 理想 地 适合 于 用 作 自 旋 锁 互 斥 元 。 最 
开始 ， 该 标志 置 为 清除 ， 互 斥 元 是 解锁 的 。 为 了 锁定 互 斥 元 ， 循 环 执 
行 test_and_set() 直 至 旧 值 为 false， 指 示 这 个 线程 将 值 设 为 true。 解 锁 此 互 
斥 元 就 是 简单 地 清除 标志 。 这 个 实现 展示 在 清单 5.1 中 。 


清单 5.1 使 用 std::atomic_flag 的 自 旋 锁 互 斥 实现 


class spinlock_mutex 


{ 
std::atomic flag flag; 
public: 
spinlock_mutex(): 
flag (ATOMIC FLAG INIT) 
Ü 


void lock(í) 
{ 


} 


void unlock.) 


{ 
} 


while (flag.test_and_set (std: :memory_order_acquire)) ; 


flag.clear(std::memory order release); 


}; 


这 样 一 个 互 斥 元 是 非常 基本 的 ， 但 它 足 以 与 std: :1ock_guard<> 一 同 使 用 
(参见 第 3 章 ) 。 就 其 本 质 而 言 ， 它 在 lock() 中 执行 了 一 个 忙 等 待 ， 因 此 如 果 你 
希望 有 任何 程度 的 竞争 ， 这 就 是 个 糟糕 的 选择 ， 但 它 足 以 确保 互 斥 。 当 我 们 观察 
内 存 顺 序 语 义 时 ， 将 看 到 这 是 如 何 保 证 与 互 斥 元 锁 相 关 的 必要 的 强制 顺序 。 这 个 
例子 将 在 5.3.6 节 中 阐述 。 


std::atomic flag 由 于 限制 性 甚至 不 能 用 作 一 个 通用 的 布尔 标识 ， 因 为 它 
不 具有 简单 的 无 修改 查询 操作 。 为 此 ， 你 最 好 还 是 使 用 std: :atomic<boo1>， 接 
下 来 我 将 介绍 之 。 


5.2.3 ”基于 std::atomic<bool> 的 操作 


最 基本 的 原子 整数 类 型 是 std: :atomic<boo1>。 如 你 所 期 望 那样 ， 这 是 一 个 
比 std: :atomic fl1ag 功 能 更 全 的 布尔 标志 。 虽 然 它 仍然 是 不 可 拷贝 构造 和 拷贝 
赋值 的 ， 但 可 以 从 一 个 非 原 子 的 boo1 来 构造 它 ， 所 以 它 可 以 被 初始 化 为 true 
或 false， 同 时 也 可 以 从 一 个 非 原子 的 bool 值 来 对 std: :atomic<bool> 的 实例 赋 
值 。 


std::atomic<bool> b(true) ; 
b=false; 


从 非 原子 的 bool 进 行 赋值 操作 还 要 注意 的 一 件 事 是 它 与 通常 的 惯例 不 同 ， 并 
TAERA e 个 引用 ， 它 返回 的 是 具有 所 赋值 的 poo1。 这 对 于 原子 类 
型 是 妨 一 种 常见 的 模式 ， 它 们 所 支持 的 赋值 操作 符 返 回 值 (属于 相应 的 非 原子 类 
型 ) 而 不 是 引用 。 如 果 返 回 的 是 原子 变量 的 引用 ， 上 所 有 依赖 于 赋值 结果 的 代码 将 
显 式 地 载 入 该 值 ， 可 能 会 获取 被 男 一 线程 修改 的 结果 。 通 过 以 非 原 子 值 的 形式 返 
eae 二 果 ， 可 以 避免 这 种 额外 的 载 入 ， 你 会 知道 所 获取 到 的 值 是 已 存储 的 实际 


与 使 用 std: :atomic_flag 的 受 限 的 clear() 函 数 不 同 ， 写 操作 (无 论 
是 true 还 是 false) 是 通过 调用 store( ) 来 完成 的 。 类 似 地 ，test_and_set() 
被 更 通用 的 exchange( ) 成 员 函 数 所 替代 ， 它 可 以 让 你 用 所 选择 的 新 值 来 代替 已 
存储 的 值 ， 同 时 获取 原 值 。std: :atomic<boo1> 支 持 对 值 的 普通 无 修改 查询 ， 通 
过 隐 式 转化 成 普通 的 poo1， 或 显 式 调 用 load()。 正 如 你 所 期 望 的 ，store() 是 一 
个 存储 操作 ， 而 load( ) 是 载 入 操作 ，exchange( ) 是 读 -修改 - 写 操作 。 


atd::atomicebools b; 

bool xsb.load(std::memory order acquire); 
b.store (true); 
x-b.exchange(false,std::memory order acq rel); 


exchange( )Jf3Estd: :atomic<boo1> 支 持 的 唯一 的 读 - 修 改 - 写 操作 ， 它 还 
引入 了 一 个 操作 ， 用 于 在 当前 值 与 期 望 值 相等 时 ， 存 储 新 的 值 。 


根据 当前 值 存储 一 个 新 值 ( 或 者 否 ) 


这 个 新 的 操作 被 称 为 比较 /交换 ， 它 以 compare_exchange_weak() 和 
compare_exchange_strong() 成 员 函 数 形式 出 现 。 比 较 / 交 换 操 作 是 使 用 原子 类 
型 编程 的 基石 ， 它 比较 原子 变量 值 和 所 提供 的 期 望 值 ， 如 果 两 者 相等 ， 则 存储 提 
供 的 期 望 值 。 如 果 两 者 不 等 ， 则 期 望 值 更 新 为 原子 变量 的 实际 值 。 比 较 / 交 换 函 数 
的 返回 类 型 为 boo1， 如 果 执行 了 存储 即 为 true， 反之 则 为 false。 


对 于 compare_exchange_weak()， 即 使 原始 值 等 于 期 望 值 也 可 能 出 现存 储 
不 成 功 ， 在 这 种 情况 下 变量 的 值 是 不 变 的 ， compare exchange. weak( ) 的 返回 
值 为 false。 BRANA vo cad 令 的 机 器 上 ， 此 时 处 理 
能 因为 执行 操作 的 线程 在 必需 的 指 令 序 列 中 间 被 
切换 出 来 同时 在 线程 多 余 AERA AER MT IE Rech 它 被 另 一 个 计划 中 的 线程 
代替 。 这 就 是 所 谓 的 伪 失 败 (spuriousfailure) ， 因 为 失败 的 原因 是 时 间 的 函数 
而 不 是 变量 的 值 。 


由 于 compare_exchange_weak() 可 能 会 伪 失 败 ， 它 通常 必须 用 在 循环 中 。 


bool expected=false; 
extern atomic<bool> b; // 在 别处 设置 
while(!b.compare exchange weak(expected,true) && !expected) ; 


在 这 种 情况 下 ， 只 要 expected 仍 为 false， 表 
明 compare_exchange_weak( ) 调 用 伪 失 败 ， 就 保持 循环 。 


另 一 方面 ， 仅 当 实际 值 不 等 于 expected 值 时 compare_exchange_strong() 
才 保 证 返回 false。 这 样 可 以 消除 对 循环 的 需求 ， 正 如 你 希望 知道 它 所 显示 的 那 
样 ， 是 否 成 功 改变 了 一 个 变量 ， 或 者 是 否 有 另 一 个 线程 抢先 抵达 。 


如 果 你 想 要 改变 变量 ， 无 论 其 初始 值 是 多 少 〈 也 许 是 用 一 个 依赖 于 当前 值 的 
更 新 值 ) ，expected 的 更 新 就 变 得 很 有 用 ， 每 次 经 过 循环 时 ，expected 被 重新 
载 入 ， 因 此 如 果 没 有 其 他 线程 在 此 期 间 修 改 其 值 ， 那 
么 compare_exchange_weak() 或 compare_exchange_strong() 的 调用 在 下 一 次 
循环 中 应 该 是 成 功 的 。 如 果 计 算 待 存储 的 值 很 简单 ， 为 了 避免 
在 compare_exchange_weak() 可 能 会 伪 失 败 的 平台 上 的 双重 循环 ，“〈 于 
是 compare_exchange_strong() 包 含 一 个 循环 ) ， 则 使 
用 compare_exchange_weak() 可 能 是 有 好 处 的 。 另 一 方面 ， 如 果 计 算 竺 存储 的 
值 本 吴 是 耗 时 的 ， 当 expected 值 没有 变化 时 ， 使 
用 compare_exchange_strong() 来 避免 被 迫 重新 计算 竺 存储 的 值 可 能 是 有 意义 
的 。 对 于 std: :atomic<bool> 而 言 这 并 不 重要 毕竟 只 有 两 个 可 能 的 值 一 一 但 
对 于 较 大 的 原子 类 型 这 会 有 所 不 同 。 


比较 /交换 函数 还 有 一 点 非 同 寻 常 ， 它 们 可 以 接受 两 个 内 存 顺 序 参数 。 这 就 允 
许 内 存 顺 序 的 语义 在 成 功 和 失败 的 情况 下 有 所 区 别 。 对 于 一 次 成 功 调用 具 
有 memory_order_acq_rel 语 义 而 一 次 失败 的 调用 有 着 memory_order_relaxed 
语义 ， 这 想必 是 极 好 的 。 一 次 失败 的 比较 /交换 并 不 进行 存储 ， 因 此 它 无 法 具 
有 memory_order_release 或 memory_order_acq_rel 语 义 。 因 此 在 失败 时 ， 禁 
止 提供 这 些 值 作为 顺序 。 你 也 不 应 为 失败 提供 比 成 功 更 严格 的 内 存 顺序 。 如 果 你 
希望 memory_order_acquire 或 者 memory_order_seq_cst 作 为 失败 的 语义 ， 你 
也 必须 为 成 功 指定 这 些 语义 。 


如 果 你 没有 为 失败 指定 一 个 顺序 ， 就 会 假定 它 与 成 功 是 相同 的 ， 除 了 顺序 的 
release 部 分 被 除去 : memory_order_release 变 
成 memory_order_relaxed，memory_order_acq_re1 变 
成 memory_order_acquire。 如 果 你 都 没有 指定 ， 它 们 通常 默认 
为 memory_order_seq_cst， 这 为 成 功 和 失败 都 提供 了 完整 的 序列 顺序 。 以 下 对 
compare_exchange_weak( ) 的 两 个 调用 是 等 价 的 。 


std::atomic<bool> b; 
bool expected; 
b.compare_exchange_weak (expected, true, 
memory order acq rel,memory order acquire); 
b.compare exchange weak(expected,true,memory order acq rel)]; 


我 将 把 选择 内 存 顺序 的 后 果 留 在 5.3 节 。 


std: :atomic<bool> 和 std::atomic flag 之 间 的 另外 一 个 区 别 
是 std: :atomic<boo1> 可 能 不 是 无 锁 的 。 为 了 保证 操作 的 原子 性 ， 实 现 可 能 需要 
内 部 地 获得 一 个 互 斥 锁 。 对 于 这 种 罕见 的 情况 ， 当 它 重 要 时 ， 你 可 以 使 
用 is_1lock_free() 成 员 函 数 检查 是 否 对 std: :atomic<bool> 的 操作 是 无 锁 的 。 
除了 std: :atomic _ flag， 对 于 所 有 原子 类 型 ， 这 是 另 一 个 特征 共同 。 


原子 类 型 中 其 次 简单 的 是 原子 指针 特 化 std: :atomic<T*>， 那 么 接 下 来 我 们 


5.2.4 std::atomic<T#> 上 的 操作 : 指针 算术 运算 


对 于 某 种 类 型 T 的 指针 的 原子 形式 是 std: :atomic<T#>， 正 如 bool1 的 原子 形 
式 是 std: :atomic<boo1> 一 样 。 接 口 基本 上 是 相同 的 ， 只 不 过 它 对 相应 的 指针 类 
型 的 值 进行 操 作 而 非 boo1 值 。 与 std: :atomic<bool1> 一 样 ， 它 既 不 能 拷贝 构 
造 ， 也 不 能 拷贝 赋值 ， 昌 然 它 可 以 从 合适 的 指针 值 中 构造 和 赋值 。 和 必须 的 
is lock _free() 成 员 函 数 一 样 ，std: :atomic<T#> 也 
有 1oad()、store()、exchange()、compare_exchange_weak() 和 
compare_exchange_strong() 成 员 函 数 ， 具 有 和 std: :atomic<boo1> 相 似 的 语 
义 ， 也 是 接受 和 返回 T* 而 不 是 boo1。 


std: :atomic<T#> 提 供 的 新 操作 是 指针 算术 运算 。 这 种 基本 的 操作 是 
由 fetch_add() 和 fetch_sub() 成 员 函 数 提供 的 ， 可 以 在 所 存储 的 地 址 上 进行 原 
子 加 法 和 减法 ，+=、-=、 带 ++ 和 -- 的 前 级 与 后 级 的 自 增 自 减 等 运算 符 ， 都 提供 了 
方便 的 封装 。 运 算 符 的 工作 方式 ， 与 你 从 内 置 类 型 中 所 期 待 的 一 样 。 如 果 x 
是 std: :atomic<Foox> 指 向 Foo 对 象 数 组 的 第 一 项 ， 那 么 x+=3 将 它 改 为 指向 第 四 
项 ， 并 返回 一 个 普通 的 指向 第 四 项 的 Foo*。fetch_add() 和 fetch_sub() 有 细微 
的 区 别 ， 它 们 返回 的 是 原 值 (所 以 x.fetch_add(3) 将 x 更 新 为 指 癌 第 四 个 值 ， 但 
是 返回 一 个 指 癌 数 组 中 的 第 一 个 值 的 指针 〉 。 访 操作 也 称 为 交换 与 添加 ， 它 是 一 
个 原子 的 读 -修改 - 写 操作 ， 就 像 exchange() 和 
compare exchange weak()/compare exchange_strong()。 与 其 他 的 操作 一 
样 ， 返 回 值 是 一 个 普通 的 T* 值 而 不 是 对 std: :atomic<T#> 对 象 的 引用 ， 因 此 ， 调 
用 代码 可 以 基于 之 前 的 值 执行 操作 。 


class Foo{}; 
Foo some array[5]; 


Std::atomic«Foo*» plsome array); Hp 加 2 并 返回 
Foo* x-p.fetch add(2); « 原来 的 值 
assert (x==some_array) ; 

assert (p.load({)==&some_array[2]); 

x=(p-=1); < à | T 
assertí(x--&some array[1]); ids * 1 并 返回 
assert (p.load()==&some_array[1]); 新 的 值 


该 函数 形式 也 允许 内 存 顺序 语义 作为 一 个 额外 的 函数 调用 参数 而 被 指定 。 
p.fetch add(3,SEd:imemory Order release) j 


因为 fetch_add() 和 fetch_sub() 都 是 读 -修改 - 写 操作 ， 所 以 它们 可 以 具有 
任意 的 内 存 顺序 标签 ， 也 可 以 参与 到 释放 序列 中 。 对 于 运算 形式 ， 指 定 顺序 语义 
是 不 可 能 的 ， 因 为 没有 办 法 提供 信息 ， 因 此 这 些 形式 总 是 具 
有 memory order_seq_cst 语 义 。 


其 余 的 基本 原子 类 型 本 质 上 都 是 一 样 的 ， 它 们 都 是 原子 整 型 ， 并 且 彼 此 都 具 
有 相同 的 接口 ， 区 别 是 相关 联 的 内 置 类 型 是 不 同 的 。 我 们 将 它们 视 为 一 个 群 组 。 


5.2.5 ”标准 原子 整 型 的 操作 
除了 一 组 通常 的 操作 


(load()、 store(). exchange(). compare_exchange_weak() fll 

compare exchange strong()) 之 外 ， 像 std: :atomic<int> 或 

者 std: :atomic<unsigned long long> 这 样 的 原子 整 型 还 有 相当 广泛 的 一 组 操 
作 可 用 : 

fetch add(). fetch sub(). fetch and(). fetch or(). fetch_xor(), 
这 些 运算 的 复合 赋值 形式 (+=、-=、&=、|= 和 ^=) ， 前 级 /后 级 自 增 和 前 级 /后 级 
自 减 (++X、X++、--X 和 Xx--) 。 这 并 不 是 很 完整 的 一 组 可 以 在 普通 的 整 型 上 进 
行 的 复合 赋值 运算 ， 但 是 已 足够 接近 了 ， 只 有 除法 、 乘 法 和 位 移 运算 符 是 缺失 
的 。 因 为 原子 整 型 值 通 常 作 为 计数 器 或 者 位 掩 码 来 使 用 ， 这 不 是 一 个 特别 明显 的 
损失 。 如 果 需 要 的 话 ， 额 外 的 操作 可 以 通过 在 一 个 循环 中 使 

用 compare_exchange_weak() 来 实现 。 


这 些 语义 和 std: :atomic<T*> 的 fetch_add() 和 fetch_sub() 的 语义 密切 地 
匹配 ， 命 名 函数 原子 级 执行 它们 的 操作 ， 并 返回 旧 值 ， 而 复合 赋值 运算 符 返 回 新 
值 。 前 缀 与 后 级 自 增 自 减 也 跟 平常 一 样 工作 ，++x 增 加 变量 值 并 返回 新 值 ， 

而 x++ 增 加 变量 并 返回 旧 值 。 正 如 你 到 目前 所 期 待 的 那样 ， 在 这 两 种 情况 下 ， 结 
果 都 是 一 个 相关 联 的 整 型 值 。 


现在 ， 我 们 已 经 了 解 了 所 有 的 基本 原子 类 型 ， 剩 下 的 就 是 泛 型 
std: :atomic<> 初 级 类 模板 而 不 是 这 些 特 化 ， 那 么 让 我 们 接着 看 下 面 的 内 容 。 


5.2.6 std::atomic<> 初 级 类 模板 


除了 标准 的 原子 类 型 ， 初 级 模板 的 存在 允许 用 户 创建 一 个 用 户 定义 的 类 型 的 
原子 变种 。 然 而 ， 你 不 能 只 是 将 用 户 定 义 类 型 用 于 std: :atomic<>， 该 类 型 必须 
满足 一 定 的 准则 。 为 了 对 用 户 定义 类 型 UDT 使 用 std: :atomic<UDT>， 这 种 类 型 必 
须 有 一 个 平凡 的 (trivial) 找 贝 赋值 运算 符 。 这 意味 着 该 类 型 不 得 拥有 任何 虚 消 
数 或 虚 基 类 ， 并 且 必 须 使 用 编译 器 生成 的 拷贝 赋值 运算 符 。 不 仅 如 此 ， 一 个 用 户 
定义 类 型 的 每 个 基 类 和 非 静 态 数据 成 员 也 都 必须 有 一 个 平凡 的 找 贝 赋值 运算 符 。 
这 实质 上 人 允许 编译 器 将 memcpy() 或 一 个 等 价 的 操作 用 于 赋值 操作 ， 因 为 没有 用 户 
编写 的 代码 要 运行 。 


最 后 ， 该 类 型 必须 是 按 位 相等 可 比较 的 。 这 伴随 着 赋值 的 要 求 ， 你 不 仅 要 能 
够 使 用 memcpy() 复 制 UDT 类 型 的 对 象 ， 而 且 还 必须 能 够 使 用 memcmp( ) 比较 实例 是 
否 相等 。 为 了 使 比较 /交换 操作 能 够 工作 ， 这 个 保证 是 必需 的 。 


这 些 限 制 的 原因 可 以 追溯 到 第 3 章 中 的 一 个 准则 ， 不 要 在 锁定 范围 之 外 ， 同 
受 保护 的 数据 通过 将 其 作为 参数 传递 给 用 户 所 提供 的 函数 的 方式 ， 传 递 指针 和 引 
用 。 一 般 情 况 下 ， 编 译 器 无 法 为 std: :atomic<UDT> 生 成 无 锁 代 码 ， 所 以 它 必须 
对 所 有 的 操作 使 用 一 个 内 部 锁 。 如 果 用 户 提供 的 拷贝 赋值 或 比较 运算 符 是 被 允许 
的 ， 这 将 需要 传递 一 个 受 保护 数据 的 引用 作为 一 个 用 户 提 供 的 函数 的 参数 ， 因 而 
违背 准则 。 同 样 地 ， 类 库 完 全 上 自由 地 为 所 有 需要 单个 锁定 的 原子 操作 使 用 单个 锁 
定 ， 并 人 允许 用 户 提 供 的 函数 被 调用 ， 虽 然 认 为 因为 一 个 比较 操作 花 了 很 长 时 间 ， 
该 锁 可 能 会 导致 死 锁 或 造成 其 他 线程 阻塞 。 最 后 ， 这 些 限 制 增加 了 编译 器 能 够 直 
接 为 std: :atomic<UDT> 利 用 原子 指令 的 机 会 〈 并 因此 使 一 个 特定 的 实例 无 
锁 ) ， 因 为 它 可 以 把 用 户 定 义 的 类 型 作为 一 组 原始 字 节 来 处 理 。 


需要 注意 的 是 ， 虽 然 你 可 以 使 用 std: : atomic<float> 
或 std: :atomic<double>， 因 为 内 置 的 浮 点 类 型 确实 满足 与 nemcpy 和 memcmp 一 
同 使 用 的 准则 ， 在 compare_exchange_strong 情 况 下 这 种 行为 可 能 会 邻 人 人 惊 
讶 。 如 果 存 储 的 值 具 有 不 同 的 表示 ， 即 使 月 的 存储 值 与 被 比较 的 值 的 数值 相等 ， 
该 操作 可 能 会 失败 。 请 注意 ， 浮 点 值 没 有 原子 的 算术 操作 。 如 果 你 使 用 一 个 具有 
定义 了 相等 比较 运算 符 的 用 户 定义 类 型 的 std: :atomic<>， 你 会 得 到 和 
compare_exchange_strong 类 似 的 情况 ， 而 且 该 操作 符 会 与 使 用 memcmp 进 行 比 
较 不 同一 一 该 操作 可 能 因 另 一 相等 值 具有 不 同 的 表示 而 失败 。 


如 果 你 的 UDT 和 一 个 int 或 一 个 void* 大 小 相同 (或 更 小 ) ， 大 部 分 常见 的 平 
台 能 够 为 std: :atomic<UDT> 使 用 原子 指令 。 一 些 平台 也 能 够 使 用 大 小 是 int 
或 void* 两 倍 的 用 户 定 义 类 型 的 原子 指令 。 这 些 平台 通常 支持 一 个 
与 compare_exchange_xxx 函 数 相对 应 的 所 谓 的 双 字 比较 和 交换 (double-word- 
compare-and-swap，DWCAS) 指令 。 正 如 你 将 在 第 7 章 中 看 到 的 ， 这 种 支持 可 以 
帮助 写 无 锁 代 码 。 


这 些 限 制 意味 着 ， 例 如 ， 你 不 能 创建 一 


个 std: :atomic<std: :vector<int>>， 但 你 可 以 把 它 与 包含 计数 器 、 标 识 符 、 
指针 、 甚 至 简单 的 数据 元 素 的 数组 的 类 一 起 使 用 。 这 不 是 特别 的 问题 。 越 是 复杂 
的 数据 结构 ， 你 就 越 有 可 能 想 在 它 之 上 进行 简单 的 赋值 和 比较 之 外 的 操作 。 如 果 
情况 是 这 样 ， 你 最 好 还 是 使 用 std: :mutex， 来 确保 所 需 的 操作 得 到 适当 的 保 
护 ， 正 如 在 第 3 章 中 所 描述 的 。 


当 使 用 一 个 用 户 定 义 的 类 型 T 进 行 实例 化 时 ，std: :atomic<T> 的 接口 被 限制 
为 一 组 操作 ， 对 于 
std::atomic«bool»:load(). store(). exchange(). compare exchange we 


以 及 赋值 目 和 转换 到 类 型 T 的 实例 ， 是 可 用 的 。 
表 5.3 展 示 了 在 每 个 原子 类 型 上 的 可 用 操作 。 


表 5.3 ”原子 类 型 的 可 用 操作 


操作 atomic_flag | atomic<bool> | atomic<T*> | 于 0 人 
E type» type» 
compare exchang e weak, 
v V V V 
compare_exchange_strong 
m i ` 
fetch_or,|= V 


fetch_and, &= 


fetch_xor, “= 


++, -- 


5.2.7 原子 操作 的 上 自由 函数 


到 现在 为 止 ， 我 一 直 限 制 自己 去 描述 原子 类 型 的 操作 的 成 员 函 数 形式 。 然 
而 ， 各 种 原子 类 型 上 的 所 有 操作 也 都 有 等 效 的 非 成 员 函 数 。 对 于 大 部 分 非 成 员 函 
数 来 说 ， 都 是 以 相应 的 成 员 函 数 来 命名 的 ， 只 是 带 有 一 个 atomic_ 前缀 《例如 
std::atomic_load()) 。 这 些 函 数 也 为 每 个 原子 类 型 进行 了 重 载 。 在 有 机 会 指 
定 内 存 顺序 标签 的 地 方 ， 它 们 有 两 个 变种 : 一 个 没有 标签 ， 一 个 带 有 _explicit 
后 缀 和 额外 的 参数 作为 内 存 顺序 的 标签 〈 例 
W, std::atomic store(&atomic var,new value) 
与 std: :atomic store explicit(&atomic var,new value,std::memory or 
相对 ) 。 被 成 员 函 数 引 用 的 原子 对 象 是 隐 式 的 ， 然 而 所 有 的 自由 函数 接受 一 个 指 
问 原子 对 象 的 指针 作为 第 一 个 参数 。 


例如 ，std: :atomic_ is lock free() 只 有 一 个 变种 《尽管 为 每 个 类 型 重 
载 ) ， 而 std: :atomic is lock free(&a) 对 于 原子 类 型 a 的 对 象 ， 
与 a.is_lock free() 返 回 相 同 的 值 。 同 样 地 ，std: :atomic_load(&a) 和 
a.1oad() 是 一 样 的 ， 但 是 a.load(std: :memory_order_acquire) 等 同 于 
std::atomic load explicit(&a, std::memory order acquire). 


自由 函数 被 设计 为 可 兼容 C 语 言 ， 所 以 它们 在 所 有 情况 下 使 用 指针 而 不 是 引 
用 。 例 如 ，compare_exchange_weak() 和 compare_exchange_strong() 成 员 函 
数 〈 期 望 值 ) 的 第 一 参数 是 引用 ， 而 std: :atomic_compare_exchange_weak() 
《第 一 个 参数 是 对 象 指针 ) 的 第 二 个 参数 是 指 
针 。std: :atomic_compare_exchange_weak_explicit() 同 时 也 需要 指定 成 功 
与 失败 的 内 存 顺序 。 而 比较 /交换 成 员 函 数 具 有 一 个 单 内 存 顺序 形式 〈 默 认 
Zjstd::memory order seq cst) 和 一 个 分 别 接受 成 功 与 失败 内 存 顺序 的 重 
EK o 


std: :atomic _ flag 上 的 操作 违反 这 一 潮流 ， 原 因 在 于 它们 在 名 字 中 拼 
出 “flag” 的 部 


I: std::atomic flag test and set(). std::atomic flag clear(), 尺 


管 指 定 内 存 顺序 的 其 他 变种 具有 _explicit 后 


BS 


Z: std::atomic flag test_and_set_explicit() fll 


std::atomic flag clear_explicit(). 


C++ 标准 库 还 提供 了 为 了 以 原子 行为 访问 std: :shared_ptr<> 实 例 的 自由 函 
数 。 这 打破 了 只 有 原子 类 型 文 持 原子 操作 的 原则 ， 因 为 std: :shared_ptr<> 很 肯 
定 地 不 是 原子 类 型 。 然 而 ，C++ 标 准 委员 会 认为 提供 这 些 额 外 的 函数 是 足够 重要 
的 。 可 用 的 原子 操作 有 : SUN doad) 、 存 储 (store) . 224% (exchange) 和 比 
较 / 交 换 Ccompare/exchange) ， 这 些 操作 以 标准 原子 类 型 上 的 相同 操作 的 重 载 的 
形式 被 提供 ， 接 受 std: :shared_ptr<>* 作 为 第 一 个 参数 。 


std::shared ptr<my data> p; 
void process global data() 


{ 
std::shared ptr«my data» local=std::atomic_load(&p) ; 
process dataílocal); 

} 

void update global data () 

{ 
Std::shared ptr«my data» local (new my data); 
std::atomic store(&p,local); 

j 


至 于 其 他 类 型 上 的 原子 操作 ，_explicit 变 量 也 被 提供 并 允许 你 指定 所 需 的 
内 存 顺 序 ，std: :atomic_is_lock_free() 函 数 可 以 用 于 检查 是 否 实现 使 用 了 锁 
以 确保 原子 性 。 


正如 在 引言 中 所 提 到 的 ， 标 准 的 原子 类 型 能 做 的 不 仅仅 是 避免 与 数据 竞争 相 
关 的 未 定义 行为 ， 它 们 允许 用 户 在 线程 间 强 制 操作 顺序 。 这 个 强制 的 顺序 是 为 保 
护 数据 和 诸如 std: :mutex 和 std: :future<> 这 样 同 步 操作 的 工具 的 基础 。 考 虑 
到 这 一 点 ， 让 我 们 进入 到 本 章 真 正 的 重点 ， 内 存 模型 的 并 发 方面 的 细节 ， 以 及 原 
子 操作 如 何 用 来 同步 数据 和 强制 顺序 。 


5.3 同步 操作 和 强制 顺序 


假设 有 两 个 线程 ， 其 中 一 个 是 要 填充 由 第 二 个 线程 所 读 取 的 数据 结构 。 为 了 
避免 有 问题 的 竞争 条 件 ， 第 一 个 线程 设置 一 个 标志 来 指示 数据 已 经 就 绪 ， 在 标志 
设置 之 前 第 二 个 线程 不 读 取 数 据 。 清 单 5.2 展 示 了 这 样 的 场景 。 

清单 5.2 ”从 不 同 的 线程 中 读 取 和 写 入 变量 


#include <vector> 
#include <atomic> 
dinclude <iostream> 


Std: :vector<int> data; 
std: :atomic<bool> data ready (false); 


void reader thread () 


i while(!data ready.load()) 0 
std::this thread::sleep(std::milliseconds(1)); 
— answer-"««data [0] ««"VXn"; <Q 
= writer thread (} 
| data.push back(42); <6 
data_ready=true; 
} 


MA SE SCR HE 6 IS EPA RRO, MAK ie BE LE, BAP AY 
话 在 线程 间 共 享 数据 就 变 得 不 可 行 ， 每 一 项 数据 都 强制 成 为 原子 的 。 你 已 经 知道 
在 没有 强制 顺序 的 情况 下 ， 非 原子 的 读 @ 和 写 全 同一 个 数据 是 未 定义 的 行为 ， 所 
以 为 了 使 其 工作 ， 茶 个 地 方 必须 有 一 个 强制 的 顺序 。 


所 要 求 的 强制 顺序 来 自 于 std: :atomic<bool> 变 量 data_ready 上 的 操作 ， 
它们 通过 happens-before (发 生 于 之 前 ) 和 synchronizes-with (与 之 同步 内存 
模型 关系 的 优点 来 提供 必要 的 顺序 。 数 据 写 入 全 友和 生 于 写 入 data_ready 标 志 @ 
之 前 ， 标 志 的 读 取 @@ 发 生 于 数据 的 读 取 人 之 前 。 当 从 data_ready@ 读 取 的 值 


为 true 时 ， 写 与 读 同 步 ， 创 建 一 个 happens-before 的 关系 。 因 为 happens-before 是 

可 传递 的 ， 数 据 的 写 入 全 发 生 于 标志 的 写 入 @@ 之 前 ， 发 生 于 从 标志 读 取 true 值 和 
之 前 ， 又 发 生 于 数据 的 读 取 之 前 ， 你 就 有 了 一 个 强制 顺序 : 数据 的 写 入 发 生 于 数 
据 的 读 取 之 前 ， 一 切 都 好 了 。 图 5.2 表 明了 两 个 线程 间 happens-before 关 系 的 重要 

性 。 我 从 读 线 程 添加 了 while 循 环 的 几 次 迭代 。 


data ready.load() 


GR [n] false) 


data.push back(42) 


data ready.load() 
(返回 false) 


data ready=true 


data ready.load() 


(返回 true) 


data[0] 


(返回 42) 


写 线程 读 线 程 
图 5.2 用 原子 操作 在 非 原子 操作 之 间 强 制 顺序 


所 有 这 一 切 都 似乎 相当 直观 ， 写 入 一 个 值 当然 发 生 在 读 取 这 个 值 之 前 ! 使 用 
默认 的 原子 操作 ， 这 的 确 是 真 的 〈 这 就 是 为 什么 它 是 于 认 的 ) ， 但 它 需 要 阐明 : 


原子 操作 对 于 顺序 要 求 也 有 其 他 的 选项 ， 这 一 点 我 马上 会 提 到 。 


现在 ， 你 已 经 在 实战 中 看 到 了 happens-before 和 synchronizes-with， 现 在 是 时 
候 来 看 看 它们 到 底 是 什么 意思 了 。 我 将 从 synchronizes-with 开 始 。 


5.3.1 synchronizes-withX 4 


synchronizes-with 关 系 是 你 只 能 在 原子 类 型 上 的 操作 之 间 得 到 的 东西 。 如 果 一 
个 数据 结构 包含 原子 类 型 ， 并 旦 在 该 数据 结构 上 的 操作 会 在 内 部 执行 适当 的 原子 
操作 ， 该 数据 结构 上 的 操作 《如 锁定 互 斥 元 ) 可 能 会 提供 这 种 关系 ， 但 是 从 根本 
上 说 synchronizes-with 关 系 只 出 自 原子 类 型 上 的 操作 。 


基本 的 思想 是 这 样 的 : 在 一 个 变量 x 上 的 一 个 被 适当 标记 的 原子 写 操作 N， 与 
在 x 上 的 一 个 被 适当 标记 的 ， 通 过 写 入 (W)， 或 是 由 与 执行 最 初 的 写 操 作 W 相 同 的 
线程 在 x 上 的 后 续 原 子 写 操作 ， 或 是 由 任意 线程 在 x 上 一 系列 的 原子 的 读 -修改 - 写 
操作 (如 fetch_add() 或 compare_exchange_weak()) 来 读 取 所 存储 的 值 的 原 
子 读 操作 同步 ， 其 中 随后 通过 第 一 个 线程 读 取 的 值 是 通过 W 写 入 的 值 (参见 5.3.4 
“pig 

现在 将 “适当 标记 ”部 分 放 在 一 边 ， 因 为 原子 类 型 的 所 有 的 操作 是 默认 适当 标 


记 的 。 这 基本 上 和 你 想 的 一 样 : 如 果 线 程 A 存 储 一 个 值 而 线程 B 读 取 该 值 ， 那 么 线 
ei) 的 存储 和 线程 B 中 的 载 入 之 间 存 在 一 种 synchronizes-with 关 系 ， 如 清单 5.2 中 


我 敢 肯 定 你 已 经 猜 到 ， 微 妙 之 处 尽 在 “适当 标记 ”的 部 分 。C++ 内 存 模 型 允许 
各 种 顺序 约束 应 用 于 原子 类 型 上 的 操作 ， 这 就 是 我 所 指 的 标记 。 内 存 顺序 的 各 种 
选项 以 及 它们 如 何 涉 及 synchronizes-with 关 系 包 含 在 5.3.3 节 中 。 让 我 们 退 一 步 来 看 
看 happens-before 关 系 。 


5.3.2 ”happens-before 关 系 


happens-before (^E TZ Bi) 关系 是 程序 中 操作 顺序 的 基本 构件 ， 它 指定 
了 哪些 操作 看 到 其 他 操作 的 结果 。 对 于 单个 线程 ， 它 是 直观 的 ， 如 果 一 个 操作 排 
在 另 一 个 操作 之 前 ， 那 么 该 操作 就 发 生 于 另 一 个 操作 之 前 。 这 就 意味 着 ， 在 源 代 
码 中 ， 如 果 一 个 操作 CAO 发 生 于 另 一 个 操作 (B) 之 前 的 语句 里 ， 那 么 A 就 发 生 
于 B 之 前 。 你 可 以 在 清单 5.2 中 看 到 : data 的 写 入 操作 @ 发 生 于 data_ready 的 读 
取 操 作 @ 之 前 。 如 果 操 作 发 生 在 同一 条 语句 中 ， 一 般 它们 之 间 没 有 happens-before 
关系 ， 因 为 它们 是 无 序 的 。 这 只 是 顺序 未 指定 的 男 一 种 说 法 。 你 知道 清单 5.3 中 的 
代码 程序 将 输出 “1,2” 或 “2,1”， 但 是 并 未 指定 究竟 是 哪个 ， 因 为 对 get_num() 的 
两 次 调用 的 顺序 未 指定 。 


清单 5.3 一 个 函数 调用 的 参数 的 估计 顺序 是 未 指定 的 


#include <iostream> 


void foo(int a,int b) 
std::cout««a««","««b««std: :endl; 
int get numí) 
static int i=0; 
return ++i; 


} 

int main() 

| | Xf get num0 的 调用 是 无 
foo (get_num(),get_num()); a 序 的 


} 


有 时 候 ， 单 条 语句 中 的 操作 是 有 顺序 的 ， 例 如 使 用 内 置 的 逗号 操作 符 或 者 使 
用 一 个 表达 式 的 结果 作为 另 一 个 表达 式 的 参数 。 但 是 ， 一 般 来 说 ， 单 条 语句 中 的 
操作 是 非 顺 序 的， 而 且 也 没有 sequenced-before 〈 因 此 也 没有 happens-before) . 4 
然 ， 一 条 语句 中 的 所 有 操作 在 下 一 句 的 所 有 操作 之 前 发 生 。 


这 确实 只 是 你 习惯 的 单线 程 顺序 规则 的 一 个 重 述 ， 那 么 新 的 呢 ? 新 的 部 分 是 
线程 之 间 的 交互 ， 如 果 线 程 间 的 一 个 线程 上 的 操作 A 发 生 于 另 一 个 线程 上 的 操作 B 
之 前 ， 那 么 A 发 生 于 B 之 前 。 这 并 没有 真 的 起 到 多 大 帮助 ， 你 只 是 增加 了 一 种 新 的 
关系 《线程 间 happens-before) ， 但 这 在 你 编写 多 线程 代码 时 是 一 个 重要 的 关系 。 


在 基础 水 平 上 ， 线 程 间 happens-before 相 对 简单 ， 并 依赖 于 5.3.1 节 中 介绍 的 
synchronizes-with 关 系 ， 如 果 一 个 线程 中 的 操作 A 与 男 一 个 线程 中 的 操作 B 同 步 ， 
那么 A 线程 间 发 生 于 B 之 前 。 这 也 是 一 个 可 传递 关系 ， 如 果 人 A 线程 间 发 生 于 B 之 
x B 线 程 间 发 生 于 C 之 前 ， 那 么 A 线 程 间 发 生 于 C 之 前 。 你 也 可 以 在 清单 5.2 中 看 
到 。 


线程 间 happens-before 还 可 与 sequenced-before 关 系 结合 ， 如 果 操 作 A 的 顺序 在 
操作 B 之 前 ， 操 作 B 线 程 间 发 生 于 C 之 前 ， 那 么 A 线程 间 发 生 于 C 之 前 。 类 似 地 ， 如 
果 人 A 与 B 同 步 ，B 的 顺序 在 操作 C 之 前 ， 那 么 A 线程 间 发 生 于 C 之 前 。 这 两 个 在 一 起 
意味 着 ， 如 果 你 对 单个 线程 中 的 数据 做 了 一 系列 的 改变 ， 对 于 执行 C 的 线程 上 的 
后 续 线 程 可 见 的 数据 ， 你 只 需要 一 个 synchronizes-with 关 系 。 


这 些 是 在 线程 间 强 制 操作 顺序 的 关键 规则 ， 使 得 清单 5.2 中 的 所 有 东西 得 以 运 
行 。 数 据 依赖 性 有 一 些 额外 的 细微 差别 ， 你 很 快 就 会 看 到 。 为 了 让 你 理解 这 一 
以 及 它们 如 何 与 synchronizes-with 
> ZIN H > E o 


5.3.3 ”原子 操作 的 内 存 顺序 
有 六 种 内 存 顺序 选项 可 以 应 用 到 原子 类 型 上 的 操 


作 : memory order relaxed. memory order consume. memory order acqu: 


和 memory_order_seq_cst。 除 非 你 为 某 个 特定 的 操作 作出 指定 ， 原 子 类 型 上 的 
所 有 操作 的 内 存 顺序 选项 都 是 memory_order_seq_cst， 这 是 最 严格 的 可 用 选 
项 。 尺 管 有 六 种 顺序 选项 ， 他 们 其 实 代 表 了 三 种 模型 :顺序 一 致 
(sequentiallyconsistent ) 顺序 (memory order seq cst) 、 获 得 -释放 
(acquire-release ) ) 顺序 

(memory order consume. memory order acquire. memory order releas 
füimemory order acq rel) ， 以 及 松散 (relaxed) 顺序 
(memory order relaxed) . 


这 些 不 同 的 内 存 顺 序 模型 在 不 同 的 CPU 架构 上 可 能 有 着 不 同 的 成 本 。 例 如 ， 
在 基于 具有 通过 处 理 器 而 非 做 更 改 者 对 操作 的 可 见 性 进行 良好 控制 染 构 上 的 系统 
中 ， 顺 序 一 致 的 顺序 相对 于 获得 -释放 顺序 或 松散 顺序 ， 以 及 获得 -释放 顺序 相对 
于 松散 顺序 ， 可 能 会 要 求 额外 的 同步 指令 。 如 果 这 些 系统 拥有 很 多 处 理 器 ， 这 些 
额外 的 同步 指令 可 能 占据 显著 的 时 间 量 ， 从 而 降低 该 系统 的 整体 性 能 。 男 一 方 
面 ， 为 了 确保 原子 性 ， 对 于 超出 需要 的 获得 -释放 排序 ， 使 用 x86 或 x86-64 架 构 
《如 在 台式 PC 中 常见 的 mtel 和 AMD 处 理 器 ) 的 CPU 不 会 要 求 额 外 的 指令 ， 甚 至 对 
顺序 一 致 顺序 不 需要 任何 特殊 的 处 理 ， 尽 管 在 存储 时 会 有 一 点 额外 


不 同 的 内 存 顺序 模型 的 可 用 性 ， 人 允许 高 手 们 利用 更 细 粒 度 的 顺序 关系 来 提升 
在 不 太 关 键 的 情况 下 ， 当 人 允许 使 用 默认 的 顺序 一 致 顺序 时 ， 他 们 是 有 优势 


为 了 选择 使 用 哪个 顺序 模型 ， 或 是 为 了 理解 使 用 不 同 模型 的 代码 中 的 顺序 关 
系 ， 了 解 该 选择 会 如 何 影响 程序 行为 是 很 重要 的 。 因 此 让 我 们 来 看 一 看 每 种 选择 
对 于 操作 顺序 和 synchronizes-with 的 后 果 。 


1. 顺序 一 致 顺序 


默认 的 顺序 被 命名 为 顺序 一 致 Csequentiallyconsistent) ， 因 为 这 意味 着 程序 
的 行为 与 一 个 简单 的 顺序 的 世界 观 是 一 致 的 。 如 果 所 有 原子 类 型 实例 上 的 操作 是 
顺序 一 致 的 ， 多 线程 程序 的 行为 ， 就 好 像 是 所 有 这 些 操 作 由 单个 线程 以 某 种 特定 
的 顺序 进行 执行 一 样 。 这 是 迄今 为 止 最 容易 理解 的 内 存 顺序 ， 这 也 是 它 作为 默认 
值 的 原因 。 上 所 有 线程 都 必须 看 到 操作 的 相同 顺序 。 这 使 得 推断 用 原子 变量 编写 的 
代码 的 行为 变 得 容易 。 你 可 以 写 下 不 同 线程 的 所 有 可 能 的 操作 顺序 ， 消 除 那些 不 
一 臻 的， 并 验证 你 的 代码 在 其 他 程序 里 是 否 和 预期 的 行为 一 样 。 这 也 意味 着 ， 操 
作 不 能 被 重 排 。 如 果 你 的 代码 在 一 个 线程 中 有 一 个 操作 在 另 一 个 之 前 ， 其 顺序 必 
须 对 所 有 其 他 的 线程 可 见 。 


从 同步 的 观点 来 看 ， 顺 序 一 致 的 存储 与 读 取 该 存储 值 的 同一 个 变量 的 顺序 一 
致 载 入 是 同步 的 。 这 提供 了 一 种 两 个 (或 多 个 ) 线程 操作 的 顺序 约束 ， 但 顺序 一 
致 比 它 更 加 强大 。 在 使 用 顺序 一 致 原子 操作 的 系统 中 ， 所 有 在 载 入 后 完成 的 顺序 
一 致 原子 操作 ， 也 必须 出 现在 其 他 线程 的 存储 之 后 。 清 单 5.4 中 的 示例 实际 演示 了 


这 个 顺序 约束 。 该 约束 并 不 会 推进 使 用 具有 松散 内 存 顺序 的 原子 操作 ， 它 们 仍然 
ee TUUM 所 以 你 必须 在 所 有 的 线程 上 使 用 顺序 一 致 的 操作 
以 获 利 。 


然而 ， 易 于 理解 就 产生 了 代价 。 在 一 个 带 有 许多 处 理 器 的 弱 顺 序 机 器 上 ， 它 
可 能 导致 显著 的 性 能 惩罚 ， 因 为 操作 的 整体 顺序 必须 与 处 理 器 之 间 保 持 一 致 ， 可 
能 需要 处 理 器 之 间 进 行 密集 〈 且 昂贵 ) 的 同步 操作 。 这 就 是 说 ， 有 些 处 理 器 架构 
《如 常见 的 x86 和 x86-64 架 构 〉 提 供 相 对 低廉 的 顺序 一 臻 性， 因此 如 果 你 担心 使 用 
顺序 一 致 顺序 对 性 能 的 影响 ， 检 查 你 的 目标 处 理 器 架构 的 文档 。 


清单 5.4 实 际 展示 了 顺序 一 致 性 。x 和 y 的 载 入 和 存储 是 
用 memory_order_seq_cst 显 式 标记 的 ， 尽 管 此 标记 在 这 种 情况 下 可 以 省 略 ， 
为 它 是 默认 的 。 


清单 5.4 顺序 一 致 隐 含 着 总 体 顺 序 


#include <atomic> 
#include <thread> 
#include <assert.h> 


std: :atomic<bool> x,y; 
std::atomic<int> z; 


void write_x() 


{ 
} 


void write y() 


{ 
} 


void read x then y() 


{ 


x. store (true, std: :memory order seq est); 0 
y-store (true, std: :memory order seq cst); O 


while(!x.load(std::memory order seq cst)); 
if(y.load(std::memory order seq cst)) -© 
+4Z; 


} 


void read y then x() 
{ 
while(!y.load(std::memory_order_seq_cst)); 
if (x.load(std::memory_ order seq cst)) «0 
+42; 


int main() 


x=false; 

y=false; 

z-0; 

std::thread a(write x); 
std::thread b(write y); 
std::thread c(read x then y); 
std::thread dí(read y then x); 
a.join(); 

b.join(); 

cort); 

d.join(); 

assert (z.load()!=0); <J e 


assert 人 可 能 永远 不 触发 ， 因 为 对 x 的 存储 @ 或 者 对 y 的 存储 @ 必 须 先 发 生 ， 

尽管 没有 特别 指定 。 如 果 read_x_then_y 中 载 入 y@ 返 回 false，x 的 存储 必须 发 
生 于 y 的 存储 之 前 ， 这 时 read_y_then_x 中 载 入 x@ 必 须 返 回 true， 因 为 while 循 
环 在 这 一 点 上 确保 y 是 true。 由 于 memory_order _seq_cst 的 语义 需要 在 所 有 标 

记 memory_order_seq_cst 的 操作 上 有 着 单个 总 体 顺 序 ， 返 回 false 的 载 入 y 合 和 
对 x 的 存储 @ 之 间 有 一 个 隐 含 的 顺序 关系 。 为 了 有 单一 的 总 体 顺序 ， 如 果 一 个 线 

程 看 到 x==true， 随 后 看 到 y==false， 这 意味 着 在 这 个 总 体 顺序 上 ，x 的 存储 发 
生 在 y 的 存储 之 前 。 


当然 ， 因 为 一 切 是 对 称 的 ， 它 也 可 能 反方 向 发 生 ，x 的 载 入 @@ 返 回 false， 迫 
使 y 的 载 入 全 返回 true。 在 这 两 种 情况 下 ，z 都 等 于 1。 两 个 载 入 都 可 能 返回 
true， 导 致 ?等 于 2， 但 是 无 论 如 何 z 都 不 可 能 等 于 0。 


对 于 read_x_then_y 看 到 x 为 true 且 y 为 false 的 情况 ， 其 操作 和 happens- 
before 关 系 如 图 5.3 所 示 。 从 read_x_then_y 中 y 的 载 入 到 write_y 中 y 的 存储 的 虚 
线 ， 展 示 了 所 需要 的 隐 含 的 顺序 关系 以 保持 顺序 一 致 。 

在 memory_order_seq_cst 操 作 的 全 局 顺序 中 ， 载 入 必须 发 生 在 存储 之 前 ， 以 达 
到 这 里 所 给 的 结果 。 


起 始 x=false, y=false 


Ta 


x.store (true) y.store (true) 


y.load() x.load() 
返回 false 返回 true 


write_x read_x_then_y read_y_then_x write_y 


图 5.3 ”顺序 一 致 和 happens-before 


顺序 一 致 是 最 直观 和 直觉 的 排序 ， 但 也 是 最 昂贵 的 内 存 顺序 ， 因 为 它 要 求 所 
上 在 多 处 理 器 系统 中 ， 这 可 能 需要 处 理 器 之 间 相 当 密 集 和 
时 的 通信 。 


为 了 避免 这 种 同步 成 本 ， 你 需要 跨 出 顺序 一 致 的 世界 ， 并 考虑 使 用 其 他 的 内 
存 顺序 。 


2. 非 顺 序 一 致 的 内 存 顺序 


一 旦 你 走出 美好 的 顺序 一 致 的 世界 ， 事 情 开 始 变 得 复杂 起 来 。 可 能 要 面 对 的 
一 个 最 大 问题 是 事件 不 再 有 单一 的 全 局 顺序 的 事实 。 这 意味 着 ， 不 同 的 线程 可 能 
看 到 相同 的 操作 的 不 同方 面 ， 以 及 你 所 拥有 的 不 同 线程 操作 一 前 一 后 整齐 交错 的 
所 有 心理 模型 都 必须 扔 到 一 边 。 你 不 仅 得 考虑 事情 真正 的 并 行 发 生 ， 而 且 线 程 不 
必 和 事 件 的 顺序 一 致 。 为 了 编写 〈 或 者 甚至 只 是 理解 ) 任何 使 用 非 默认 的 
memory_order_seq_cst 内 存 顺序 的 代码 ， 让 你 的 大 脑 思 考 这 个 问题 绝对 是 至 关 
重要 的 。 这 不 仅仅 意味 着 编译 器 能 够 重新 排列 指令 。 即 使 线程 正在 运行 完全 相同 
的 代码 ， 由 于 其 他 线程 中 的 操作 没有 明确 的 顺序 约束 ， 它 们 可 能 与 事件 的 顺序 不 
一 致 ， 因 为 不 同 的 CPU 缓存 和 内 部 缓冲 区 可 能 为 相同 的 内 存 保存 了 不 同 的 值 。 它 
是 如 此 重要 以 至 于 我 要 再 说 一 遍 : 线程 不 必 和 事 件 的 顺序 一 致 。 


你 不 仅 要 将 基于 交错 操作 的 心理 模型 扔 到 一 边 ， 还 得 将 基于 编译 占 或 处 理 融 
重 排 指令 的 思想 的 心理 模型 也 扔 掉 。 在 没有 其 他 的 顺序 约束 时 ， 唯 一 的 要 求 是 所 
有 的 线程 对 每 个 独立 变量 的 修改 顺序 达成 一 致 。 不 同 变 量 上 的 操作 可 以 以 不 同 的 
0 


通过 完全 跳出 顺序 一 致 的 世界 ， 并 未 所 有 操作 使 
用 memory_order_relaxed， 就 是 最 好 的 展示 。 一 旦 你 掌握 7 了， 就 可 以 回 过 头 来 
看 获得 -释放 顺序 ， 它 让 你 选择 性 地 在 操作 之 间 引 入 顺序 关系 ， 夺 回 一 些 理性 。 


3. 松散 顺序 


以 松散 顺序 执行 的 原子 类 型 上 的 操作 不 参与 synchronizes-with 关 系 。 单 线程 中 
的 同一 个 变量 的 操作 仍然 服从 happens-before 关 系 ， 但 相对 于 其 他 线程 的 顺序 几乎 
没有 任何 要 求 。 唯 一 的 要 求 是 ， 从 同一 个 线程 对 单个 原子 变量 的 访问 不 能 被 重 
排 ， 一 旦 给 定 的 线程 已 经 看 到 了 原子 变量 的 特定 值 ， 该 线程 之 后 的 读 取 就 不 能 获 
取 该 变量 更 早 的 值 。 在 没有 任何 额外 的 同步 的 情况 下 ， 每 个 变量 的 修改 顺序 是 使 
用 memory_order_relaxed 的 线程 之 间 唯 一 共享 的 东西 。 


为 了 展示 松散 顺序 操作 到 底 能 多 松散 ， 你 只 需要 两 个 线程 ， 如 清单 5.5 所 示 。 
清单 5.5 放松 操作 有 极 少 数 的 排序 要 求 


#include «atomic» 
#include <thread> 
H#Hinclude <assert.h> 


std: :atomic<bool> x,y; 
std::atomic<int> Z; 


void write x then y() 


{ 


x.store (Crue, std: :memory order relaxed); 0 


y.store (true, std: smemory order relaxed); iQ 


} 


void read y then x() 

{ 
while(!y.load(std::memory order relaxed)); «e 
Ir(x.load(std::memory order relaxed) } ^6 


-Z; 


int main(í) 


x-false; 

y=false; 

zz0; 

Std: {thread alwrite x ‘then y); 
std::thread b(read y then x); 
a.join(); 

b. Jorn) 

assert (z.load()!=0); O 


这 次 assert@ 可 以 触发 ， 因 为 x 的 载 入 @ 能 够 读 到 false， 即 便 是 y 的 载 入 @ 
读 到 了 true 并 且 x 的 存储 @ 发 生 于 y 存 储 @ 之 前 。x 和 y 是 不 同 的 变量 ， 所 以 关于 每 
个 操作 所 产生 的 值 的 可 见 性 没有 顺序 保证 。 


不 同 变量 的 松散 操作 可 以 被 自由 地 重 排 ， 前 提 是 它们 服从 所 有 约束 下 的 
happens-before 关 系 〈 例 如 ， 在 同一 个 线程 中 ) 。 它 们 并 不 引入 synchronizes-with 


关系 。 清 单 5.5 中 的 happens-before 关 系 如 图 5.4 所 示 ， 伴 随 一 个 可 能 的 结果 。 即 便 
在 存储 操作 之 间 和 载 入 操作 之 间 存 在 happens- before 关 系 ， 但 任 一 存储 和 任 一 载 入 
之 间 却 不 存在 ， 所 以 载 入 可 以 在 顺序 之 外 看 到 存储 。 


起 始 x=false, y=false 


f —7 
x.store(true, 
relaxed) 


y.store (true, y. load (relaxed) 

relaxed) 返回 true 
x.load (relaxed) 
返回 false 


write x then y read y then x 


图 5.4 ”松散 的 原子 和 happens-before 
让 我 们 在 清单 5.6 中 看 一 看 带 有 三 个 变量 和 五 个 线程 的 稍微 复杂 的 例子 。 
清单 5.6 多 线程 的 松散 操作 


#include <thread> 
#include <atomic> 
#include <iostream> 


std::atomiceint> x(0),y(0),2(0); -© 
std: :atomic<bool> go(false) ; ^6 


unsigned const loop countz10; 


struct read values 


( 
: 


read values valuesl[loop count]; 
read values values2[loop count]; 
read values values3[loop count]; 
read values values4[loop count]; 
read values values5[loop count]; 


int x,y,z; 


void increment (std: :atomic<int>* var to inc,read values* values) 


( 
while (!go) 
std::this_thread::yield(); “e 旋转 ， 等 待 信号 
for (unsigned i=0;i<loop_count;++i)} 
{ 
values[i].x-x.load(std::memory order relaxed); 
values [i] .y=y.load(std: :memory_order_relaxed) ; 
values [i] .z=z.load(std: :memory_ order relaxed); 
var_to_inc->store(i+1,std::memory_order_relaxed) ; 0 
std: :this thread: :yield(); 
} 
} 


void read_vals(read_values* values) 
{ ag 旋转 ， 等 待 信号 
while (!go) 
std::this thread: :yield(); 
for(unsigned i=0;i<loop_count;++i) 


{ 
values[i].x-x.load(std::memory order relaxed); 
values[i].y-y.load(std::memory order relaxed); 
values[i].z-z.load(std::memory order relaxed); 
std::this thread::yield(); 
} 
} 
void print (read_values* v) 
{ 


for (unsigned i=0;i<loop_count;++i) 


{ 
if (i) 


std: :cout<<","; 
std: :cout<<"("<<v[i] .x<<","<<v[i] .yec" , "<ev [i] Zee"); 


std: :cout<<std::endl; 


int main() 


std::thread tl(increment, &x,values1) ; 
std: :thread t2 (increment, &y,values2) ; 
std::thread t3 (increment, &z,values3) ; 
std: :thread t4(read vals,values4); 
std: :thread t5(read vals,values5); 


go=true; +, 
Q 开始 执行 主 循环 的 
信号 


t5.join(); 
t4.join(); 
t3.join(); 
t2.join(); 


t1.join(); [7] 打印 最 终 的 值 
print (values1) ; a 

print (values2) ; 

print (values3) ; 

print (values4); 

print (values5); 


本 质 上 这 是 一 个 非常 简单 的 程序 。 你 有 三 个 共享 的 全 局 原子 变量 Q@ 和 五 个 线 
程 。 每 个 线程 循环 10 次 ， 用 memory_order_relaxed 读 取 三 个 原子 变量 的 值 ， 并 
将 其 存储 在 数组 中 。 这 三 个 线程 中 的 每 个 线程 每 次 通过 循环 人 @ 更 新 其 中 一 个 原子 
变量 ， 而 其 他 两 个 线程 只 是 读 取 。 一 旦 所 有 的 线程 都 被 连接 ， 你 就 打印 由 每 个 线 
程 存储 在 数组 中 的 值 @. 


原子 变量 go@ 用 来 确保 所 有 的 线程 尽 可 能 靠近 相同 的 时 间 开 始 循环 。 启 动 一 
个 线程 是 一 个 昂贵 的 操作 ， 知 没有 明确 的 延迟 ， 第 一 个 线程 可 能 会 在 最 后 一 个 线 
程 开始 前 就 结束 了 。 每 个 线程 在 进入 主 循环 之 前 等 待 go 变 成 true 人 @、 全 ， 仪 当 所 
有 的 线程 都 已 经 开始 后 @，go 才 被 设置 成 true。 


这 个 程序 的 一 个 可 能 的 输出 如 下 所 示 。 


(0,0,0), (1,0,0), (2,0,0),(3,0,0), (4,0,0), (5,7,0), (6,7,8), (7,9,8) , (8,9,8), 


(9,9,10) 
(0,0,0) r (Ol sD (0,2,0), (1, 35.5) r (8,4,5), (8,5,5), (8,6,6) r GB LD) y (3:0, 8,59). 
(10,9,10) 
(0,0,0),(0,0,1),(0,0,2),(0,0,3), (0,0,4), (0,0,5), (0,0,6), (0,0,7), (0,0,8), 
(0,0,9) 


(15 3,:004 (2,340) , (2,4, 13 , (34 6,4) (34:945) , (544/0,/6).41(50,10.,8) , (5; 10,10) 
[9, 10,309 , (10,10,10) 

(0,0,0), (0,0,0), (0,0,0), (6,3, 7), (6,5, 7) , (7,7, 7) , U7, B, 7), (8,8, 7) , (8,8,9), 
(B, 8,9) 


前 三 行 是 线程 在 进行 更 新 ， 最 后 两 行 是 线程 仅 进行 读 取 。 每 个 三 元 组 是 一 组 
变量 x、y 和 z 以 这 样 的 顺序 经 历 循环 。 这 个 输出 中 有 几 点 要 注意 。 


。 第 一 系列 值 显 示 了 x 在 每 个 三 元 组 里 依次 增加 1， 第 二 系列 y 依 次 增加 1， 以 及 
第 三 系列 z 依 次 增加 1。 

每 个 三 元 组 的 x 元 素 仅 在 给 定 系 列 中 目 增 ，y 和 z 元 素 也 一 样 ， 但 增 量 不 是 平 
均 的 ， 而 且 在 所 有 线程 之 间 的 相对 顺序 也 不 同 。 

线程 3 并 没有 看 到 任何 的 x 或 y 的 更 新 ， 它 只 能 看 到 它 对 z 的 更 新 。 然 而 这 并 不 
能 阻止 其 他 线程 看 到 对 z 的 更 新 混合 在 对 x 和 y 的 更 新 中 。 


这 对 于 松散 操作 是 一 个 有 效 的 结果 ， 但 并 非 唯 一 有 效 的 结果 。 任 何 由 三 个 变 
量 组 成 ， 每 个 变量 轮流 保存 从 0 到 10 的 值 ， 同 时 使 得 线程 递增 给 定 的 变量 ， 并 打 
印 出 该 变量 从 0 到 9 的 值 的 一 系列 值 ， 都 是 有 效 的 。 


4. 理解 松散 顺序 


为 了 理解 这 是 如 何 工 作 的 ， 想 象 每 个 变量 是 一 个 在 小 隔 间 里 使 用 记事 本 的 
人 。 在 他 的 记事 本 上 有 一 列 值 。 你 可 以 打 电 话 给 他 ， 要 求 他 给 你 一 个 值 ， 或 者 你 
可 以 告诉 他 写 下 了 一 个 新 值 。 如 果 你 告诉 他 写 下 新 值 ， 他 就 将 其 写 在 列表 底部 。 
如 果 你 向 他 要 一 个 值 ， 他 就 为 你 从 列表 中 读 取 一 个 数字 。 


第 一 次 你 跟 这 个 人 交谈 ， 如 果 你 向 他 要 一 个 值 ， 此 时 他 可 能 从 他 记事 本 上 的 
列表 里 任意 给 你 一 个 值 。 如 果 你 接着 向 他 要 为 一 个 值 ， 他 可 能 会 再 次 给 你 同一 个 
值 ， 或 是 从 列表 下 方 给 你 一 个 。 他 永远 不 会 给 你 一 个 在 列表 中 更 上 面 的 值 。 如 果 
你 告诉 他 写 下 一 个 数字 ， 然 后 再 要 一 个 值 ， 他 要 么 给 你 刚才 你 让 他 写 下 的 数字 ， 
或 者 是 列表 上 在 那 以 下 的 数字 。 


假设 某 一 次 他 的 列表 以 这 些 值 开 始 5、10、23、3、1、2。 如 果 你 要 一 个 值 ， 
你 会 得 到 其 中 的 任意 一 个 。 如 果 他 给 你 10， 下 一 次 他 可 能 再 给 你 一 个 10， 或 者 后 
面 的 其 他 值 ， 但 不 会 是 gs。 如果 你 呼叫 他 5 次 ， 举 个 例子 ， 他 可 能 会 说 “10、10、 
1、2、2”。 如 果 你 告诉 他 写 下 42， 他 会 将 其 添加 在 列表 末尾 。 如 果 你 再 疝 他 要 数 
字 ， 他 将 一 直 告 诉 你 “42”， 直 到 他 的 列表 上 有 另 一 个 数 ， 并 且 他 愿意 告诉 你 时 。 


现在 ， 假 设 你 的 朋友 Carl 也 有 这 个 人 的 号 码 。Carl 也 可 以 打 电 话 给 他 ， 要 么 请 
他 写 下 一 个 数字 或 是 索取 一 个 数字 ， 他 跟 对 待 你 一 样 ， 对 Carl 应 用 相同 的 规则 。 
他 只 有 一 部 电话 ， 因 此 他 一 次 只 能 处 理 你 们 中 的 一 个 人 ， 所 以 他 记事 本 上 的 列表 
是 一 个 非常 直观 的 列表 。 但 是 ， 仪 仪 因为 你 让 他 写 下 了 新 的 号 码 ， 并 不 意味 着 他 
必须 将 其 告诉 Cal， 反 之 亦 然 。 如 果 Carl 向 他 索取 一 个 数字 ， 并 被 告知 “23”， 然 后 
仅仅 因为 你 要 求 这 个 人 写 下 42 并 不 意味 着 他 下 一 次 就 会 告诉 Carl。 他 可 能 会 将 
23、3、1、2、42 这 些 数字 中 的 任何 一 个 告诉 Carl， 或 者 其 至 是 在 你 呼叫 他 之 后 ， 
Fred 告 诉 他 写 下 来 的 67。 他 很 可 能 会 告诉 Carl*23、3、3、1、67”， 这 与 他 告诉 你 
的 也 没什么 矛盾 。 就 像 是 他 为 每 个 人 设 了 一 个 小 小 的 移动 便签 ， 把 他 对 谁 说 了 什 
么 数 都 进行 了 记录 ， 如 图 5.5 所 示 。 


to 
as 
3 
工 
2 
42 You 


图 5.5 ”小 隔 间 里 的 人 的 笔记 本 


现在 假设 不 仅仅 是 一 个 人 在 一 个 小 隔 间 ， 而 是 整个 隔 间 群 ， 有 一 大 帮 带 着 电 
话 和 笔记 本 的 人 。 这 些 都 是 我 们 的 原子 变量 。 每 一 个 变量 都 有 自己 的 修改 顺序 
《笔记 本 上 的 列表 的 值 ) ， 但 是 它们 之 间 完 全 没有 关系 。 如 果 任 意 一 个 呼叫 者 
《你 、Carl、Anne、Dave 和 Fred) 是 一 个 线程 ， 那 么 这 就 是 每 个 操作 都 使 用 
memory_order_relaxed 时 你 所 得 到 的 东西 。 还 有 一 些 你 可 以 告诉 隔 间 里 的 人 的 额外 
的 事情 ， 比 如 “ 记 下 这 个 号 码 ， 并 告诉 我 列表 的 底部 是 什么 ”Cexchange) 和“ 写 下 
这 个 数字 ， 如 果 列 表 底 部 的 数字 正 是 它 ， 否 则 告诉 我 应 该 猜 到 什 
么 ”(compare_exchange_strong) ， 但 是 这 并 不 影响 一 般 的 ”原则 。 


如 果 你 仔细 地 想 一 想 清单 5.5 中 的 程序 逻辑 ，write_x_then_y 就 像 是 某 个 家 
伙 打 电话 告诉 小 隔 间 x 中 的 人 让 他 写 下 true， 然 后 再 打 电 话 给 小 隔 间 y 中 的 人 让 他 
写 下 true。 运 行 read_y_then_x 的 线程 不 断 地 呼叫 小 隔 间 y 中 的 人 询问 一 个 值 ， 
一 直到 他 说 true， 然 后 再 向 小 隔 间 x 中 的 人 询问 值 。 这 个 在 小 隅 间 x 中 的 人 没有 义 
告诉 你 他 列表 上 的 任何 一 个 具体 的 值 ， 并 且 还 有 权利 说 false。 


这 就 使 得 松散 的 原子 操作 难以 处 理 。 他 们 必须 与 具有 更 强 的 顺序 语义 的 原子 
操作 结合 起 来 使 用 ， 以 便 在 线程 间 同 步 中 发 挥 作用 。 我 强烈 建议 避免 松散 的 原子 
操作 ， 除 非 绝 对 必要 ， 即 便 这 样 ， 也 应 该 极其 谨慎 地 使 用 之 。 在 清单 5.5 中 ， 仅 仅 
是 两 个 线程 和 两 个 变量 就 能 让 所 得 到 的 结果 这 样 不 直观 ， 鉴 于 此 ， 不 难 想象 在 涉 
及 更 多 线程 和 变量 的 时 候 ， 会 变 得 多 么 复杂 。 


二 一 种 避免 全 面 顺序 一 致 性 开销 的 达到 额外 同步 的 方法 ， 是 使 用 获取 -释放 顺 
Te 
5. 获取 -释放 顺序 


获取 -释放 顺序 是 松散 顺序 的 进步 ， 操 作 仍 然 没 有 总 的 顺序 ， 但 的 确 引 入 了 一 
些 同 步 。 在 这 种 顺序 模型 下 ， 原 子 载 入 是 获取 Caquire) 操作 
(memory order acquire) ， 原 子 存储 是 释放 (release) 操作 
(memory order release) ， 原 子 的 读 - 修 改 - 写 操作 (例如 fetch_add() 


或 exchange() ) 是 获取 、 释 放 或 两 者 兼备 (memory order acq rel) 。 同 步 
在 进行 释放 的 线程 和 进行 获取 的 线程 之 间 是 对 偶 的 。 释 放 操 作 与 读 取 写 入 值 的 获 
取 操 作 同 步 。 这 意味 着 ， 不 同 的 线程 仍然 可 以 看 到 不 同 的 排序 ， 但 这 些 顺 序 是 受 
到 限制 的 。 清 单 5.7 采 用 获取 -释放 语义 而 不 是 顺序 一 致 顺序 ， 对 清单 5.4 进 行 了 改 
Ze 


清单 5.7 获取 -释放 并 不 意味 着 总 体 排序 


#include <atomic> 
#include «thread» 
#include «assert.h» 


std: :atomic<bool> x,y; 
std::atomic<int> z; 


void write_x() 


{ 
} 


x.store(true,std::memory order release); 


void write y() 


{ 
} 


y.store (true, std: :memory order release); 


void read x then y() 


{ 


} 


while(!x.load(std::memory order acquire)); 


if(y.load(std::memory order acquire) ) 
++Z; 


void read y then x() 


{ 


int 


while(!y.load(std::memory order acquire)); 
if(x.load(std::memory order acquire)) 
+423 


mainí) 


x-false; 

y=false; 

z-0; 

std::thread aiwrite.x); 
std::thread bí(write y); 
std::thread cí(read x then y); 
std::thread dí(read y then x); 
a.join(); 

b.join() 
Ca oun 
d.join() 
assert (z.load{}!=0); +@ 


, 
r 
. 
f 


二 全 


-© 


在 这 个 例子 里 ， 断 言 全 可 以 触发 (就 像 在 松散 顺序 中 的 例子 )， 因 为 对 x 的 
载 入 和 对 y 的 载 入 @ 都 读 取 false 是 可 能 的 。x 和 y 由 不 同 的 线程 写 入 ， 所 以 每 种 
情况 下 从 释放 到 获取 的 顺序 对 于 男 一 个 线程 中 的 操作 是 没有 影响 的 。 


图 5.6 展 示 了 清单 5.7 中 的 happens-before 关 系 ， 伴 随 一 种 可 能 的 结果 ， 即 两 个 
读 线 程 看 到 了 世界 的 不 同方 面 。 这 可 能 是 因为 没有 像 前 面 提 到 的 happens-before 关 
系 来 强制 顺序 。 


| #246 x=false, y=false | 


x.store(true, y-store (true, 
release) release) 


x.load (acquire) y-load (acquire) 


返回 true 返回 true 


y. load (acquire) x.load (acquire) 


返回 false j& [n] false 


write_x read_x_then_y read_y_then_x write_y 


图 5.6 ”获取 -释放 和 happens-before 


为 看 到 获取 -释放 顺序 的 优点 ， 你 需要 考虑 类 似 清 单 5.5 中 来 自 同一 个 线程 中 
的 两 个 存储 。 如 果 你 将 对 y 的 存储 更 改 为 使 用 memory_order_release， 并 且 让 
对 y 的 载 入 使 用 类 似 于 清单 5.8 中 的 memory_order_acquire， 那 么 你 实际 上 就 对 x 
上 的 操作 施加 了 一 个 顺序 。 


清单 5.8 获取 -释放 操作 可 以 在 松散 操作 中 施加 顺序 


#include <atomic> 
#include <thread> 
#include <assert.h> 


std: :atomic<bool> x,y; 
std::atomic<int> z; 


void write x then y() 旋转 ， 等 待 y 被 
{ 设 为 true 
x.store(true,std::memory order relaxed); 
y.store(true,std::memory order release); <} © 
void read_y_then_x() 
{ 
while(!y.load(std::memory order acquire)); < © 
if (x.load(std::memory order relaxed)) —0 


+4+Z;7 


) 


int main() 


{ 
x=false; 
y=false; 
zz 
std::thread a(write x then y); 
std::thread b(read y then x); 
a.join{); 
b- Joint); 
assert (z.load(}!=0); O 


最 终 ， 对 y 的 加 载 @ 将 会 看 到 由 存储 写 下 的 true@。 因 为 存储 使 

用 memory_order_release 并 日 载 入 使 用 memory_order_acquire， 存 储 与 载 入 
同步 。 对 x 的 存储 @ 友 生 在 对 y 的 存储 @ 之 前 ， 因 为 它们 在 同一 个 线程 里 。 因 为 对 
y 的 存储 与 从 y 的 载 入 同步 ， 对 x 的 存储 同样 发 生 于 从 y 的 载 入 之 前 ， 并 且 推 而 广 之 
发 生 于 从 x 的 载 入 @ 之 前 。 于 是 ， 从 x 的 载 入 必然 读 到 true， 而 且 断 言 @ 不 会 触 
发 。 如 果 从 y 的 载 入 不 在 while 循 环 里 ， 就 不 一 定 是 这 个 情况 ， 从 y 的 载 入 可 能 读 
到 false， 在 这 种 情况 下 ， 对 从 x 读 取 到 的 值 就 没有 要 求 了 。 为 了 提供 同步 ， 获 取 
和 释放 操作 必须 配对 。 由 释放 操作 存储 的 值 必须 被 获取 操作 看 到 ， 以 便 两 者 中 的 
任意 一 个 生效 。 如 果 人 处 的 存储 或 @ 处 的 载 入 有 一 个 是 松散 操作 ， 对 x 的 访问 就 
没有 顺序 ， 因 此 就 不 能 确保 全 处 的 载 入 读 取 true， 且 assert 会 被 触发 。 


你 仍然 可 以 用 带 着 笔记 本 在 他 们 小 隔 间 的 人 们 的 形式 来 考虑 获取 -释放 顺序 ， 
但 是 你 必须 对 模型 添加 更 多 。 首 先 ， 假 定 每 个 已 完成 的 存储 都 是 一 批 更 新 的 一 部 
分 ， 因 此 当 你 呼叫 一 个 人 证 他 写 下 一 个 数字 时 ， 你 也 要 告诉 他 这 次 更 新 是 哪 一 批 
的 一 部 分 :“ 请 写 下 99， 作 为 第 423 批 的 一 部 分 ”。 对 于 一 批 的 最 后 一 次 存储 ， 你 也 


可 以 这 样 告诉 他 : “请 写 下 147， 作 为 第 423 批 的 最 后 一 次 的 存储 ”。 小 隔 间 中 的 人 
会 及 时 地 写 下 这 一 信息 ， 以 及 谁 给 了 他 这 些 值 。 这 模拟 了 一 个 存储 -释放 操作 。 下 
一 次 ， 你 告诉 茶 人 写 下 一 个 值 ， 你 应 增加 批 次 号 码 :“ 请 写 下 41， 作 为 第 424 批 的 


一 部 分 ”。 


当 你 询问 一 个 值 时 ， 会 有 一 个 选择 :你 可 以 仅仅 询问 一 个 值 〈 这 是 个 松散 载 
入 ) ， 在 此 情况 下 这 个 人 只 会 给 你 一 个 数字 ， 或 者 你 可 以 询问 一 个 值 以 及 它 是 不 
是 这 一 批 中 最 后 一 个 数 的 信息 模拟 载 入 -获取 〉。 如 果 你 询问 批 次 信息 ， 并 且 该 
值 不 是 这 一 批 中 的 最 后 一 个 ， 他 会 告诉 你 类 似 于 “这 个 数字 是 987， 仅 仅 是 一 个 “ 普 
通 ' 的 值 >， 然 而 如 果 它 曾经 是 这 一 批 中 的 最 后 一 个 ， 他 会 告诉 你 类 似 于 “这 个 数字 
是 987， 是 来 自 Anne 的 第 956 批 的 最 后 一 个 数 "。 现 在 ， 获 取 - 释 放 语 义 内 潍 登 场 : 
如 果 当 你 询问 一 个 值 时 告诉 他 你 所 知道 的 所 有 批 次 ， 他 会 从 他 的 列表 中 同 下 碍 
找 ， 找 到 你 所 知道 的 任意 一 个 批 次 的 最 后 一 个 值 ， 并 且 要 么 给 你 那个 数字 ， 要 么 
列表 更 下 方 的 一 个 数 子 。 


这 是 如 何 模拟 获取 -释放 语义 的 呢 ? 让 我 们 看 一 看 这 个 例子 。 最 开始 ， 线 程 a 
运行 write_x_then_y 并 对 小 隔 间 x 内 的 人 说 ，“ 请 写 下 true 作 为 线程 a 第 一 批 的 一 
部 分 ”， 然 后 他 及 时 地 写 下 了 。 线 程 a 随 后 对 小 隔 间 y 内 的 人 说 , “请 写 下 true 作 为 
线程 a 第 一 批 的 最 后 一 笔 ”， 他 也 及 时 地 写 下 了 。 与 此 同时 ， 线 程 b 运 行 
着 read_y_then_x。 线 程 b 持 续 地 向 小 隔 间 y 里 的 人 索取 带 着 批 次 信息 的 值 ， 直 到 
他 说 “true”。 他 可 能 要 询问 很 多 次 ， 但 是 最 终 这 个 人 总 会 说 “true”。 但 是 在 小 隔 
间 y 里 的 人 不 能 仅仅 说 “true”; 他 还 要 说 “这 是 线程 a 第 一 批 的 最 后 一 笔 ”。 


现在 ， 线 程 b 继 续 癌 盒子 x 里 的 人 询问 值 ， 但 是 这 一 次 他 说 :“ 请 让 我 拥有 一 
个 值 ， 并 且 通 过 这 一 方式 让 我 知晓 线程 a 的 第 一 批 ?。 所 以 现在 ， 小 隔 间 x 中 的 人 
必须 查看 他 的 列表 ， 找 到 线程 a 中 第 一 批 的 最 后 一 次 提 及 。 他 所 具有 的 唯一 一 次 
提 及 是 true 值 ， 同 时 也 是 列表 上 的 最 后 一 个 值 ， 所 以 他 必须 读 取 该 值 ;， 否则 ， 他 
会 破坏 游戏 规则 。 


如 果 你 回 到 5.3.2 节 查看 线程 间 happens-before 的 定义 ， 一 个 重要 的 内 容 就 是 
它 的 传递 性 : 如果 A 线程 间 发 生 于 B 之 前 ， 并 且 B 线 程 间 发 生 于 C 之 前 ， 则 A 线程 
间 发 生 于 C 之 前 。 这 意味 着 获取 -释放 顺序 可 以 用 来 在 多 个 线程 之 间 同 步 数 据 ， 甚 
至 在 “中 间 线 程 ?并 没有 实际 接触 数据 的 场合 。 


6. 获取 -释放 顺序 传递 性 同步 


为 了 考虑 传递 性 顺序 ， 你 需要 至 少 三 个 线程 。 第 一 个 线程 修改 一 些 共享 变 
量 ， 并 对 其 中 一 个 进行 存储 -释放 。 第 二 个 线程 接着 对 应 于 存储 -释放 ， 使 用 载 入 - 
获取 来 读 取 该 变量 ， 并 且 在 第 二 个 共享 变量 执行 存储 -释放 。 最 后 ， 第 三 个 线程 在 
第 二 个 共享 变量 上 进行 载 入 -获取 。 在 载 入 -获取 操作 看 到 存储 -释放 操作 所 写 入 的 
值 以 确保 synchronizes-with 关 系 的 前 提 下 ， 第 三 个 线程 可 以 读 取 由 第 一 个 线程 存储 
i eS 即使 中 间 线 程 没 有 动 其 中 的 任何 一 个 。 该 情景 展示 于 清单 5.9 


清单 5.9 使 用 获取 和 释放 顺序 的 传递 性 同步 


std: :atomic<int> data[5]; 
std: :atomic<bool> syncl (false) ,sync2 (false) ; 


void thread 1() 

( 
data[0].store(42,std::memory order relaxed); 
data[1]l.store(97,std::memory order relaxed); 
data[2].store(17,std::memory order relaxed); 
data[3].store(-141,std::memory order relaxed); 
data[4].store(2003,std::memory order relaxed); Án 
syncl.store(true,std::memory order release); < 

} 

void thread_2() 


{ 


while(!synci.load(std::memory order acquire));  «—€) 循环 直到 syncl 被 设置 
sync2.store(true,std::memory order release); 4 
© 设置 sync2 


} 


void thread 3() 


{ 
while(!sync2.1load(std::memory order acquire)); <3 — 
assert (data[0].1oad(std::memory order relaxed)--42); 往 环 直到 sync2 
assert (data[1] .load(std: :memory_order_relaxed) ==97) ; 被 设置 
assert (data[2] . load (std: :memory_order_relaxed) ==17) ; 
assert (data[3] .load(std: :memory_order_relaxed) ==-141) ; 
assert (data [4] .load(std: :memory_order relaxed) ==2003) ; 


即使 thread_2 只 动 了 变量 syncl@ 和 sync2 人 @， 也 足以 同步 thread_1 和 
thread_3 以 确保 assert 不 会 触发 。 首 先 ， 从 thread_1 存 储 data 发 生 于 对 sync1 
的 存储 @ 之 前 ， 因 为 他 们 在 同一 个 线程 里 是 sequenced-before 关 系 。 因 为 sync1@ 
的 载 入 在 while 循 环 中 ， 它 最 终 会 看 到 thread_1 中 存储 的 值 ， 并 且 因此 形成 释 
放 - 获 取 对 的 另 一 半 。 因 此 ， 对 sync1 的 存储 发 生 于 sync1 在 while 循 环 中 的 最 后 
的 载 入 之 前 。 该 载 入 的 顺序 在 sync2@ 之 前 (因而 也 是 happens-before 的 〉， 

与 thread_3 中 while 循 环 @ 构 成 了 一 对 释放 -获取 。 对 sync2 的 存储 全 也 就 因而 发 
生 在 载 入 @ 之 前 ， 叉 发生 在 从 data 载 入 之 前 。 因 为 happens-before 的 传递 性 质 ， 你 
可 以 将 它们 串 起 来 : 对 data 的 存储 发 生 在 对 syncl 的 存储 @ 之 前 ， 又 发 生 在 从 
synci 的 载 入 @ 之 前 ， 又 发 生 在 对 sync2 的 存储 @ 之 前 ， 又 发 生 在 从 sync2 的 载 入 
@ 之 前 ， 又 发 生 在 data 的 载 入 之 前 。 因 此 thread_1 中 对 data 的 存储 发 生 

在 thread_3 中 从 data 载 入 之 前 ， 并 且 asserts 不 会 触发 。 


在 这 个 例子 中 ， 你 通过 使 用 在 thread_2 中 的 一 个 具 
有 memory_order_acq_rel 的 读 -修改 - 写 操作 ， 将 sync1 和 sync2 合 并 为 一 个 变 
量 。 有 一 个 选项 是 使 用 compare_exchange_strong()， 以 确保 该 值 只 有 
当 thread_1 中 的 存储 可 见 时 才能 被 更 新 。 


std::atomic«int» sync(0); 
void thread 1() 


{ 
A Ws 
sync.store(l1,std::memory order release); 
) 
void thread 2() 
{ 
int expected-1; 
while(!sync.compare exchange strong (expected,2, 
std: :memory order acq rel)) 
expected-1; 
} 
void thread 3() 
{ 
while (sync. load (std: :memory order acquire) <2); 
D diia 


如 果 你 使 用 的 读 - 修 改 - 写 操作 ， 挑 选 你 所 希望 的 语义 是 很 重要 的 。 在 这 种 情 
况 下 ， 你 同时 需要 获取 和 释放 语义 ， 因 此 memory_order_acq_rel 是 合适 的 ， 但 
是 你 也 可 以 使 用 其 他 的 顺序 。 具 有 memory_order_acquire 语 义 的 fetch_sub 操 
作 不 与 任何 东西 同步 ， 即 便 是 它 存储 一 个 值 ， 因 为 它 并 不 是 一 个 释放 操作 。 同 样 
地 ， 一 次 存储 无 法 与 具有 memory_order_release 语 义 的 fetch_or 操 作 同 步 ， 
为 fetch_or 的 读 取 部 分 并 不 是 一 个 获取 操作 。 具 有 memory_order_acq_rel 语 义 
的 读 - 修 改 - 写 操作 表现 得 既 像 获取 又 像 释放 ， 所 以 之 前 的 一 次 存储 可 以 与 这 样 的 
操作 同步 ， 并 且 它 也 可 以 与 之 后 的 一 次 载 入 同步 ， 就 像 这 个 例子 中 的 情况 一 样 。 


如 果 你 将 获取 -释放 操作 与 顺序 一 致 操作 混合 起 来 ， 顺 序 一 致 载 入 表现 的 像 是 
获取 语义 的 载 入 ， 并 且 顺 序 一 致 存储 表现 的 像 是 释放 语义 的 存储 。 顺 序 一 致 的 读 - 
修改 - 写 操作 表现 得 既 像 获 取 又 像 释 放 操 作 。 松 散 操 作 仍 然 是 松散 的 ， 但 是 会 收 到 
额外 的 synchronizes-with 和 随 之 而 来 的 happens-before 关 系 的 约束 ， 这 是 由 于 获取 - 
释放 语义 的 使 用 而 引入 的 。 


暂且 不 管 可 能 存在 的 不 直观 的 后 果 ， 任 何 使 用 锁 的 人 都 不 得 不 面 对 相 同 的 顺 
序 问题 ， 锁 定 互 斥 元 是 一 个 获取 操作 ， 而 解锁 互 斥 元 是 一 个 释放 操作 。 对 于 互 斥 
元 ， 你 了 解 到 必须 确保 当 你 读 取 一 个 值 的 时 候 ， 锁 定 与 你 写 它 时 曾 锁定 的 相同 的 
HU: 你 的 获取 和 释放 操作 必须 是 对 同一 个 变量 以 确保 顺序 。 如 果 数 据 受到 互 
斥 元 的 保护 ， 锁 的 独占 特性 意味 着 结果 与 令 它 的 锁定 与 解锁 成 为 顺序 一 致 操作 所 
得 到 结果 没有 区 别 。 类 似 地 ， 如 果 你 在 原子 变量 上 使 用 获取 与 释放 顺序 建立 一 个 
简单 的 锁 ， 那 么 从 使 用 该 锁 的 代码 的 角度 来 看 ， 其 行为 会 表现 为 顺序 一 致 ， 即 便 
内 部 的 操作 并 非 这 样 。 


如 果 你 对 你 的 原子 操作 不 需要 顺序 一 致 顺序 的 严格 性 ， 获 取 - 释 放 顺 序 的 配对 
同步 可 能 会 比 顺 序 一 致 操作 所 要 求 的 全 局 顺序 有 着 低 得 多 的 同步 成 本 。 这 里 需要 
eg 以 及 线程 间 不 直观 的 行为 不 会 出 问题 所 需求 


7. 使 用 获取 -释放 顺序 和 MEMORY ORDER_CONSUME 的 数据 依赖 


在 本 节 的 绪论 中 我 提 到 了 memory_order_consume 是 获取 -释放 顺序 模型 的 一 
部 分 ， 但 前 面 的 描述 中 它 很 明显 的 缺失 了 。 这 是 因为 nemory_order_consume 是 
很 特别 的 ， 它 全 是 关于 数据 依赖 ， 它 引入 了 与 5.3.2 节 中 提 到 的 线程 间 happens- 
before 关 系 有 着 细微 差别 的 数据 依赖 。 


有 两 个 处 理 数据 依赖 的 新 的 关系 : 依赖 顺序 在 其 之 前 (dependency-ordered- 
before) 和 带 有 对 其 的 依赖 Ccarries-a-dependency-to) 。 与 sequenced-before 相 
似 ，carries-a- dependency-to 严 格 适 用 于 单个 线程 之 内 ， 是 操作 间 数 据 依赖 的 基本 
模型 。 如 果 操 作 A 的 结果 被 用 作 操 作 B 的 操作 数 ， 那 么 A 带 有 对 B 的 依赖 。 如 果 操 
作 A 的 结果 是 类 似 int 的 标量 类 型 的 值 ， 那 么 如 果 A 的 结果 存储 在 一 个 变量 中 ， 并 
且 该 变量 随后 被 用 作 操 作 B 的 操作 数 ， 此 关系 也 是 适用 的 。 这 种 操作 也 具有 传递 
性 ， 所 以 如 果 A 市 有 对 B 的 依赖 且 B 带 有 对 C 的 依赖 ， 那 么 A 融 有 对 C 的 依赖 。 


另 一 方面 ，dependency-ordered-before 的 关系 可 以 适用 于 线程 之 间 。 它 是 通过 
使 用 标记 了 memory_order_consume 的 原子 载 入 操作 引入 的 。 这 
是 memory_order_acquire 的 一 种 特例 ， 它 限制 了 对 直接 依赖 的 数据 同步 。 标 记 
为 memory_order_release、memory_order acq rel 
或 nemory_order_seq_cst 的 存储 操作 A 的 依赖 顺序 在 标记 
为 memory_order_consume 的 载 入 操作 之 前 ， 如 果 此 次 消耗 读 取 所 存储 值 的 话 。 
如 果 载 入 使 用 memory_order_acquire， 那 么 这 与 synchronizes-with 关 系 所 得 到 的 
是 相反 的 。 如 果 操 作 B 带 有 对 操作 C 的 某 种 依赖 ， 那 么 A 也 是 依赖 顺序 在 C 之 前 。 


如 果 这 对 线程 间 happens-before 关 系 没 有 影响 ， 那 么 在 同步 目的 上 就 无 法 为 你 
带 来 任何 好 处 ， 但 它 的 确实 现 了 : 如 果 A 依 赖 顺序 在 B 之 前 ， 则 A 也 是 线程 间 发 生 
FBZ il. 


这 种 内 存 顺序 的 一 个 重要 用 途 ， 是 在 原子 操作 载 入 指向 某 数据 的 指针 的 场 
合 。 通 过 在 载 入 上 使 用 memory_order_consume 以 及 在 之 前 的 存储 上 使 
用 memory_order_release， 你 可 以 确保 所 指向 的 数据 得 到 正确 地 同步 ， 无 需 在 
其 他 非 依赖 的 数据 上 强加 任何 同步 需求 。 清 单 5.10 显 示 了 这 种 情况 的 例子 。 


清单 5.10 ”使 用 std::memory_order_consume 同 步 数 据 


struct X 
int i; 
std::string s; 


}; 


std::atomic<X*> p; 
Std: :atomic<int> a; 


void ereate xi) 


X* x-new X; 
X->1=42; 


x-»gz"hello"; 9 
a.store(99,std::memory order relaxed); 
p.store(í(x,std::memory order release); -+ 


} 


void use xí) 


{ 


X* x; 

while(!(x-p.load(std::memory order consume))) .9 
std: :this_thread: :sleep (std: :chrono: :microseconds (1)); 

assertí(x-»i--42); 

assert (x->s=="hello”) ; 

assert (a.load(std: :memory order relaxed} ==99) ; 0O 


int main({) 


std! sthread: tl(ocreate x); 
std::thread t2(use x); 
t1.join{); 

t2.join(); 


RER a B FF E IIE PE XT pH TE HO AT, JF HOM PHU TE fA An iO 
为 nemory_order_release，p 的 载 入 @ 被 标记 memory_order_consume。 这 意 
味 着 ， 对 p 的 存储 只 发 生 在 依赖 p 的 载 入 值 的 表达 式 之 前 。 这 还 意味 着 ， 在 Xx 结构 
的 数据 成 员 人 @、 人 @ 上 的 断言 保证 不 会 被 触发 ， 因 为 p 的 载 入 带 有 对 那些 通过 变量 x 


的 表达 式 的 依赖 。 男 一 方面 ， 在 a 的 值 上 的 断言 @ 或 许 会 触发 ， 或 许 不 被 触发 ; 
此 操作 并 不 依赖 于 从 p 载 入 的 值 ， 因 而 对 读 到 的 值 就 没有 保证 。 如 你 所 见 ， 因 为 
它 被 标记 为 nemory_order_relaxed， 所 以 特别 的 显著 。 


有 时 候 ， 你 并 不 希望 四 处 带 着 依赖 所 造成 的 开销 。 你 想 让 编译 器 能 够 在 寄存 
器 中 缓存 值 ， 并 且 对 操作 进行 重新 排序 以 优化 代码 ， 而 不 用 担心 依赖 。 在 这 些 情 
形 下 ， 你 可 以 使 用 std: :kill dependency() 显 式 地 打破 依赖 链 
条 。std: :kil1_dependency() 是 一 个 简单 的 函数 模板 ， 它 将 所 提供 的 参数 复制 
到 返回 值 ， 但 这 样 做 会 打破 依赖 链条 。 例 如 ， 如 果 你 有 一 个 全 局 的 的 只 读数 组 ， 
你 在 从 另外 的 线程 中 获取 该 数组 的 索引 时 使 用 了 
std::memory order_consume， 你 可 以 用 std: :kill dependency() 让 编译 器 
知道 它 无 需 重 新 读 取 数 组 项 的 内 容 ， 就 像 下 面 的 这 个 例子 。 


int global data[]={ .. }; 
std::atomic<int> index; 
void fi) 


{ 


int iszindex.load(std::memory order consume); 
do something with(global data[std::kill dependency(i)]); 


当然 ， 在 这 样 一 个 简单 的 场景 里 你 一 般 根 本 不 会 使 
用 std: :memory_order_consume， 但 是 你 可 能 会 在 具有 更 复杂 代码 的 相似 情形 
下 调用 std: :kill_dependency()。 你 必须 记 住 这 是 一 项 优化 ， 所 以 只 应 小 心地 
使 用 ， 用 在 优化 器 表明 需要 使 用 的 地 方 。 


现在 ， 我 已 经 涵盖 了 内 存 顺 序 的 基础 ， 是 时 候 看 看 synchronizes-with 关 系 中 更 
复杂 的 部 分 ， 即 体现 为 释放 序列 (releasesequence) 的 形式 。 


5.3.4 释放 序列 和 synchronizes-with 


早 在 5.3.1 节 ， 我 提 到 过 你 可 以 在 对 原子 变量 的 载 入 ， 和 来 自 另 一 个 线程 的 对 
该 原子 变量 的 载 入 之 间 ， 建 立 一 个 synchronizes-with 关 系 ， 即 便 是 在 存储 和 载 入 之 
间 有 一 个 读 -修改 - 写 顺 序 的 操作 存在 的 情况 下 ， 前 提 是 所 有 的 操作 都 作 了 适当 的 
标记 。 现 在 既然 我 已 经 介绍 了 可 能 的 内 存 顺序 “标签 ”， 我 承 可 以 详细 解释 这 一 
点 。 如 果 存 储 被 标记 为 nemory_order_release、memory_order acq_rel 
或 memory_order_seq_cst， 载 入 被 标记 
7jmemory order consume. memory order acquire 
或 memory_order_seq_cst， 并 且 链 条 中 的 每 个 操作 都 载 入 由 之 前 操作 写 入 的 
值 ， 那 么 ， 该 操作 链条 就 构成 了 一 个 释放 序列 CGreleasesequence) ， 并 且 最 初 的 
存储 与 最 终 的 载 入 是 synchronizes-with 的 (例如 memory_order_acquire 
或 nemory_order_seq_cst) 或 者 是 dependency-ordered-before 和 的 《例如 


memory_order_consume) 。 该 链条 中 的 所 有 原子 的 读 - 修 改 - 写 操作 都 可 以 具有 
任意 的 内 存 顺序 〈 甚 至 是 memory_order_relaxed) 。 


要 了 解 这 是 什么 意思 以 及 它 为 什么 很 重要 ， 考 虑 atomic<int> 作 为 在 一 个 共 
享 的 队列 中 的 项 目 数 量 的 count， 如 清单 5.11 所 示 。 


清单 5.11 使 用 原子 操作 从 队列 中 读 取 值 


#include <atomic> 
#include <thread> 


std::vector<int> queue_data; 
std: :atomic<int> count; 


void populate_queue() 
{ 
unsigned const number of items-20; 
queue data.clear(); 
for(unsigned i=0;i<number_of_items;++i) 
{ 
queue data.push back(i); 


) 


最 初 的 
i 存储 
count.store(number of items,std::memory order release); 5 n 
} 
void consume queue items() 一 个 读 -修改 - 
写 操作 


while (true) 
{ 
int item_index; 
if ((item_index=count .fetch_sub(1,std::memory_order_acquire))<=0) < 一 


{ 


wait for more items(); any 
continue; 8 $e 
项 目 


} 


rocess (queue data[item index-1]); 、 PS 
á T m = p 读 取 queue_data 是 安 


) 全 的 


int main() 

{ 
std::thread a(populate queue); 
std::thread b(consume queue items); 
std::thread c(consume queue items); 
a.join(); 
b.join(); 
c.join(); 


处 理事 情 的 方法 之 一 是 让 产生 数据 的 线程 将 项 目 存储 在 一 个 共享 的 缓冲 区 
中 ， 然 后 执行 count .store(number_of items,memory order _ release)@it 
其 他 线程 知道 数据 可 用 。 消 耗 队 列 项 目的 线程 接着 可 能 会 执 
ffcount.fetch sub(1,memory _ order_acquire) 人 队列 中 索取 一 个 项 目 ， 在 实 


Doa CUBES: 一 旦 count 变 为 零 ， 又 没有 更 多 的 项 目 ， 线 程 就 必须 


AERE 


如 果 只 有 一 个 消费 者 线程 ， 这 是 良好 的 。fetch_sub() 是 一 个 具 
有 memory_order_acquire 语 义 的 读 取 ， 并 且 存 储 具 有 memory_order_release 
语义 ， 所 以 存储 与 载 入 同步 ， 并 且 该 线程 可 以 从 缓冲 区 里 读 取 项 目 。 如 果 有 两 个 
线程 在 读 ， 第 二 个 fetch_sub() 将 会 看 到 由 第 一 个 写 下 的 值 ， 而 非 由 store 写 下 
的 值 。 知 没有 该 释放 序列 的 规则 ， 第 二 个 线程 不 会 具有 与 第 一 个 线程 的 happens- 
before 关 系 ， don use UE ea E 除非 第 一 个 fetch_sub() 也 具 
有 memory_order_release 语 义 ， 这 会 带 来 两 个 消费 者 线程 之 间 不 必要 的 同步 。 
如 果 在 fetch DI EA RAUF AMIA Rmenory order. release, 就 没 
有 什么 外 要求 对 queue_ data 的 存储 对 第 二 个 消费 者 可 见 ， 你 就 会 遇 到 数据 竞 
争 。 笠 运 的 是 ， 第 一 个 fetch_sub() 的 确 参与 了 释放 序列 ， 并 因此 store() 与 第 
二 个 fetch_sub() 同 步 。 这 两 个 消费 者 线程 之 间 依 然 没 有 synchronizes-with 关 系 。 
图 5.7 中 的 虚线 表示 的 是 释放 序列 ， 实 线 表示 的 是 happens-before 


在 这 一 链条 中 ， 可 以 有 任意 数量 的 链接 ， 但 前 提 是 它们 都 是 
似 fetch_sub() 这 样 的 读 -修改 - 写 操作 ，store() 仍 然 LR 
有 memory_order_acquire 标 记 的 操作 同步 。 在 这 个 例子 里 ， 所 有 的 链接 都 是 一 
都 是 获取 操作 ， 但 它们 可 以 由 具有 不 同 的 内 存 顺序 语义 的 不 同 操作 组 合 而 


尽管 大 多 数 的 同步 关系 来 自 于 应 用 到 原子 变量 操作 的 内 存 顺 序 语义 ， 但 通过 
屏障 〈fence) 来 引入 额外 的 顺序 约束 也 是 可 能 的 。 


填充 
queue data 
count.store() 
释放 
| 


count.fetch sub() 
获取 
处 理 count.fetch sub() 
queue data 获取 
处 理 
queue data 


populate queue consume queue items consume queue items 


图 5.7 清单 5.11 中 队列 操作 的 释放 序列 


5.3.5 ”屏障 


没有 一 套 屏 障 的 原子 操作 库 是 不 完整 的 。 这 些 操 作 可 以 强制 内 存 顺 序 约束 ， 

而 无 需 修 改 任何 数据 ， 并 且 与 使 用 memory_order_relaxed 顺 序 约束 的 原子 操作 
组 合 起 来 使 用 。 屏 障 是 全 局 操作 ， 能 在 执行 该 屏障 的 线程 里 影响 其 他 原子 操作 的 
顺序 。 屏 障 一 般 也 被 称 为 内 存 障碍 (memorybarriers) ， 它 们 之 所 以 这 样 命名 ， 
是 因为 它们 在 代码 中 放置 了 一 行 代 码 ， 使 得 特定 的 操作 无 法 穿越 。 也 许 你 还 记得 
5.3.3 节 中 ， 在 独立 变量 上 的 松散 操作 通常 可 以 自由 地 被 编译 器 或 硬件 重新 排序 。 
屏障 限制 了 这 一 自由 ， 并 且 在 之 前 并 不 存在 的 地 方 引 入 happens-before 和 
synchronizes-withX % . 


让 我 们 从 在 清单 5.5 中 的 每 个 线程 上 的 两 个 原子 操作 之 间 添 加 屏障 开始 ， 如 清 
单 5.12 所 示 。 


清单 5.12 松散 操作 可 以 使 用 屏障 来 排序 


#include <atomic> 
#include <thread> 
#include «assert.h» 


std: :atomic<bool> x,y; 
std::atomic<int> Zz; 


void write x then y() 


{ 


x.store (true, std: :memory_order_ relaxed); 0 


std::atomic thread fence(std::memory order release); a 
y.store(true,std::memory order relaxed); 


} 


void read_y_then_x() 


i 


std::atomic thread fence(std::memory order acquire); 
if(x.load(std::memory order relaxed)) 
+42; 


-© 


while(!y.load(std::memory order relaxed)); D 


int main() 


x-false; 

y=false; 

z-0; 

std::thread a(write x then y); 
std: sthread. b(read y then x); 
a.join(); 

b.join(); 

assert (z.load({) '=0); —9 


释放 屏障 全 与 获取 屏障 全 同步 ， 因 为 从 y 的 载 入 @ 在 读 取 存 储 在 全 的 值 。 这 
意味 着 对 x 的 存储 @ 发 生 在 从 x 的 载 入 @ 之 前 ， 所 以 读 取 的 值 必然 是 ture， 并 且 在 
人 @ 处 的 断言 不 会 触发 。 这 与 原来 没有 屏障 的 情况 下 ， 对 x 的 存储 和 从 x 的 载 入 没有 
顺序 ， 是 相反 的 ， 所 以 断言 可 以 触发 。 注 意 ， 这 两 个 屏障 都 是 必要 的 ， 你 需要 在 
uo epic S 在 另 一 个 线程 中 有 一 个 获取 ， 从 而 实现 synchronizes-with 


在 这 种 情况 下 ， 释 放 屏 障 @ 的 效果 ， 与 对 y 的 存储 @ 被 标记 


为 memory_order_release 而 不 是 memory_order_relaxed 是 相似 的 。 同 样 ， 获 
取 屏 障 回 令 其 与 从 y 的 载 入 四 被 标记 为 memory_order_acquire 相 似 。 这 是 屏障 
的 总 体 思 路 : 如 果 获 取 操 作 看 到 了 释放 屏障 后 发 生 的 存储 的 结果 ， 该 屏障 与 获取 
操作 同步 ， 如果 在 获取 屏障 之 前 发 生 的 载 入 看 到 释放 操作 的 结果 ， 该 释放 操作 与 
获取 屏障 同步 。 当 然 ， 你 可 以 在 两 边 都 设置 屏障 ， 就 像 在 这 里 的 例子 一 样 ， 在 这 
种 情况 下 ， 如 果 在 获取 屏障 之 前 发 生 的 载 入 看 见 了 释放 屏障 之 后 发 生 的 存储 所 写 
下 的 值 ， 该 释放 屏障 与 获取 屏障 同步 。 


尽管 屏障 同步 依赖 于 在 屏障 之 前 或 之 后 的 操作 所 读 取 或 写 入 的 值 ， 注 意 同 步 
点 就 是 屏障 本 号 是 很 重要 的 。 如 果 你 从 清单 5.12 中 将 write_x_then_y 拿 走 ， 将 对 
x 的 写 入 移 到 下 面 的 屏障 之 后 ， 断 言 中 的 条 件 就 不 再 保证 是 真 的 ， 即 便 对 x 的 写 入 
在 对 y 的 写 入 之 前 。 


void write x then y() 


| 


std::atomic thread fence(std::memory order release); 


x.store(true,std::memory order relaxed); 
y.store(true,std::memory order relaxed); 


这 两 个 操作 不 再 被 屏障 分 隔 ， 所 以 也 不 再 有 序 。 只 有 当 屏 障 出 现在 对 x 的 存 
储 和 对 y 的 存储 之 间 时 ， 才 能 施加 顺序 。 当 然 ， 屏 障 的 存在 与 否 并 不 影响 现存 
的 ， 由 其 他 原子 操作 带 来 的 happens-before 关 系 所 强制 的 顺序 。 


这 个 例子 中 ， 以 及 本 章 中 目前 为 止 几乎 所 有 其 他 的 例子 ， 完 全 是 从 具有 原子 
类 型 的 变量 建立 起 来 的 。 然 而 ， 使 用 原子 操作 来 强制 顺序 的 真正 优点 ， 是 它们 可 
以 在 非 原 子 操作 上 强制 顺序 ， 并 且 因此 避免 了 数据 竞争 的 未 定义 行为 ， 就 像 之 前 
你 在 清单 5.2 中 所 看 到 的 那样 。 


5.3.6 ”用 原子 操作 排序 非 原子 操作 


如 果 你 将 清单 5.12 中 的 x 丛 换 为 一 个 普通 的 非 原子 boo1 值 (如 清单 5.13 所 
示 ) ， 该 行为 确保 是 相同 的 。 


清单 5.13 在 非 原 子 操作 上 强制 顺序 


#include «atomic» 
#include <thread> 


#include «assert.h» x 现 在 是 一 个 普通 的 非 原 
于 变量 


bool x=false; 
std: :atomic<bool> y; 
std: :atomic<int> z; 


void write x then y() 在 屏障 前 存储 x 

{ 
x=true; Rs 
std::atomic thread fence(std::memory order release); 
y.store(true,std::memory order relaxed); + 

} O 在 屏障 后 存储 y 

void read y then x() — ‘ 

{ e SAMAR BA 的 
while(!y.load(std::memory order relaxed)); 与 人 


Std::atomic thread fence(std::memory order acquire); 
if (x) 4 
) Fish 写 人 的 值 
int main() 
x=false; 
y=false; 
z-0; 
std::thread a(write x then y); 
std::thread bí(read y then x); 
a.join(); 
b.join() ; 6 此 断言 不 会 触发 
< 十 一 


assert (z.load() !=0); 


屏障 仍然 为 对 x 的 存储 @、 对 y 的 存储 人 @@、 从 y 的 载 入 @ 和 从 x 的 载 入 @ 提 供 了 
强制 顺序 ， 并 且 在 对 x 的 存储 和 从 x 的 载 入 之 间 仍 然 有 happens-before 关 系 ， 所 以 断 
言 @ 还 是 不 会 触发 。 存 储 @ 和 载 入 @y 仍 然 必须 是 原子 的 ， 否 则 ， 在 y 上 就 会 有 数 
据 竞 争 ， 但 是 屏障 在 x 的 操作 上 强制 了 顺序 ， 一 旦 读 线程 看 见 了 已 存储 的 y 值 。 这 
个 强制 顺序 意味 着 x 上 没有 数据 竞争 ， 即 使 它 被 一 个 线程 修改 并 且 被 另 一 个 线程 


读 取 。 


并 不 是 只 有 屏障 才能 排序 非 原子 操作 。 你 之 前 在 清单 5.10 中 看 到 的 
Hjmemory order release/memory _ order_consume 对 偶 来 排序 对 动态 分 配对 象 
的 访问 ， 以 及 本 章 中 的 许多 例子 ， 都 可 以 通过 将 其 中 一 些 
memory_order_relaxed 操 作 蔡 换 为 普通 的 非 原 子 操作 来 进行 重 写 。 


通过 使 用 原子 操作 来 排序 非 原子 操作 ， 是 happens-before 中 的 sedquenced-before 
部 分 变 得 如 此 重要 的 所 在 。 如 果 一 个 非 原子 操作 的 顺序 在 一 个 原子 操作 之 前 ， 同 
时 该 原子 操作 发 生 于 另 一 个 线程 中 的 操作 之 前 ， 这 个 非 原 子 操作 同样 发 生 在 另 一 
个 线程 的 该 操作 之 前 。 这 就 是 清单 5.13 中 x 上 的 操作 顺序 的 来 历 ， 也 是 清单 5.2 中 
的 示例 可 以 工作 的 原因 。 这 也 是 C++ 标准 库 中 更 高 级 别 的 同步 功能 的 基础 ， 比 如 
想 看 一 看 这 是 如 何 工作 的 ， 考 虑 一 下 清单 5.1 中 的 简单 的 自 旋 
gu JU。 


lock() 操 作 是 在 flag.test_and_set() 上 的 循环 ， 使 用 的 
是 std: :memory_order_acquire 顺 序 ， 而 unlock() 是 对 flag.clear() 的 调 
用 ， 用 的 是 std: :memory_order_release 顺 序 。 当 第 一 个 线程 调用 lock() 时 ， 
标志 被 初始 化 为 清除 ， 所 以 第 一 次 调用 test_and_set() 将 设置 标志 并 返回 
false， 表 明 该 线程 现在 拥有 了 锁 ， 并 且 终 止 循环 。 线 程 接 下 来 就 可 以 自由 地 修 
改 被 互 斥 元 保护 的 任何 数据 。 此 时 所 有 其 他 调用 lock() 的 线程 会 发 现 标志 已 经 被 
设置 ， 而 且 会 被 阻塞 在 test_and_set() 循 环 中 。 


当 持 有 锁 的 线程 已 完成 修改 受 保护 的 数据 时 ， 它 会 调用 unlock()， 继 而 调用 
有 具有 std: :memory_order_release 语 义 的 flag.clear()。 然 后 它 会 与 后 续 的 来 
自 另 一 线程 上 lock() 的 调用 中 的 对 flag.test_and_set() 的 调用 同步 ， 因 为 该 
调用 具有 std: :memory_order_acquire 语 义 。 由 于 对 受 保 护 数据 的 修改 必然 顺 
序 在 unlock() 之 前 ， 于 是 也 就 发 生 在 后 续 的 来 自 于 第 二 个 线程 的 lock() 之 前 
(因为 unlock() 和 1lock() 之 间 的 Synchronizes-with 关 系 ) ， 并 且 发 生 在 来 自 于 第 
二 个 线程 的 对 数据 的 任意 访问 之 前 ， 一 旦 第 二 个 线程 获取 了 锁 。 


虽然 其 他 的 互 斥 元 的 实现 会 具有 不 同 的 内 部 操作 ， 但 其 基本 原理 是 相同 
的 ，lock() 是 在 一 个 内 部 内 存 地 址 上 的 获取 操作 ，un1lock() 是 在 相同 内 存 地 址 
上 的 释放 操作 。 


5.4 ”小结 


本 章 介 绍 了 C++11 内 存 模型 的 底层 细节 ， 以 及 在 线程 间 提 供 同 步 基础 的 原子 
操作 。 这 包括 了 由 std: :atomic<> 类 模板 的 特 化 提供 的 基本 原子 类 型 ， 
由 std: :atomic<> 主 模板 提供 的 泛 型 原子 接口 ， 在 这 些 类 型 上 的 操作 ， 以 及 各 种 
内 存 顺序 选项 的 复杂 细节 。 


我 们 还 看 了 屏障 ， 以 及 它们 如 何 通 过 原子 类 型 上 的 操作 配对 ， 以 强制 顺序 。 
最 后 ， 我 们 回 到 开头 ， 看 了 看 原子 操作 是 如 何 用 来 在 独立 线程 上 的 非 原子 操作 之 
间 强 制 顺序 的 。 


在 接 下 来 的 章节 中 ， 我 们 将 学 习 在 原子 操作 之 外 使 用 高 级 同步 功能 ， 来 为 并 
发 访问 设计 高 效 的 容器 ， 而 且 我 们 会 编号 并 行 处 理 数据 的 算法 。 


第 6 革 ”设计 基于 锁 的 并 发 数据 结构 
本 章 主要 内 容 


。 为 并 发 设计 数据 结构 的 含义 
。 这 么 做 的 准则 
。 实现 设计 满足 并 发 性 的 数据 结构 的 例子 


上 一 章 中 我 们 寻找 原子 操作 和 存储 器 模式 的 底层 细节 。 在 这 一 章 中 ， 我 们 移 
不 探讨 底层 细节 《尽管 第 7 章 中 我 们 需要 用 到 它们 ) 而 是 考虑 数据 结构 。 


程序 设计 问题 中 选择 什么 样 的 数据 结构 是 总 体 解决 方法 的 关键 部 分 ， 对 于 并 
行程 序 设计 问题 也 不 例外 。 如 果 多 线程 用 到 了 数据 结构 ， 那 么 此 数据 结构 要 么 完 
全 不 可 变 ， 即 从 不 发 生变 化 也 不 需要 同步 ， 要 么 程序 设计 中 就 要 保障 线程 间 能 
确 同步 变 化 。 一 种 选择 就 是 使 用 单独 的 互 斥 元 和 外 部 锁 来 保护 数据 ， 使 用 我 们 在 
人 “UREN Pelle eee 


当 为 并 发 性 设计 数据 结构 时 ， 你 可 以 使 用 前 面 章节 中 介绍 的 多 线程 应 用 程序 
中 的 基本 构造 模块 ， 例 如 互 太 元 和 条 件 变量 。 实 际 上 ， 我 们 已 经 看 到 了 几 个 例 
0 
安全 性 。 


这 章 中 ， 我 们 首先 考虑 为 并 发 性 设计 数据 结构 时 的 一 般 准则 。 然 后 我 们 采取 
基本 构造 模块 和 条 件 变 量 ， 并 且 在 我 们 进入 到 更 加 复杂 的 数据 结构 前 先 回顾 一 下 
这 些 基础 数据 结构 。 在 第 7 半 中 ， 我 们 考虑 如 何 回 到 基础 并 且 使 用 第 5 章 中 摘 述 的 
原子 操作 来 建立 无 锁 的 数据 结构 。 


那么 ， 言 归 正 传 ， 让 我 们 考虑 为 并 发 性 设计 一 种 数据 结构 时 需要 涉及 到 哪些 


方面 


61 为 并 友 设 计 的 含义 是 什么 


在 最 基本 的 层面 ， 为 并 发 设计 数据 结构 意味 着 多 个 线程 可 以 同时 使 用 此 数据 
结构 ， 执 行 相同 或 不 同 的 操作 ， 并 且 每 个 线程 都 有 数据 结构 的 一 致 性 视图 。 不 会 
丢失 或 破坏 数据 ， 维 持 所 有 不 变量 ， 并 且 没 有 不 确定 的 竞争 条 件 ， 此 种 数据 结构 
就 被 称 为 线程 安全 的 。 通 常 ， 只 有 在 特定 的 并 及 存 取 下 ， 一 种 数据 结构 才 是 安全 
的 。 很 有 可 能 出 现 这 种 情况 ， 就 是 多 个 线程 对 数据 结构 执行 同一 种 操作 ， 然 而 男 
一 个 线程 的 操作 需要 进行 独占 访问 。 或 者 ， 也 许多 个 线程 执行 不 同 的 操作 ， 它 们 
并 发 地 存 取 茶 个 数据 结构 是 安全 的 。 然 而 多 个 线程 执行 相同 的 操作 ， 它 们 并 发 地 
存 取 茶 个 数据 结构 可 能 会 有 问题 。 


实际 上 并 发 设计 远 远 不 只 是 为 多 个 线程 提供 存 取 数 据 结构 的 并 发 机 会 。 本 质 
上 ， 互 斥 元 提供 的 是 互 斥 ， 一 次 只 允许 一 个 线程 获取 互 太 元 的 锁 。 一 个 互 斥 元 通 
过 明确 阻止 对 它 所 保护 的 数据 进行 并 发 存 取 来 保护 数据 结构 。 


这 被 称 为 序列 化 Cerialization? : 多 个 线程 轮流 存 取 互 斥 元 保护 的 数据 ， 它 
们 必须 线性 地 而 非 并 发 地 存 取 数 据 。 所 以 ， 你 必须 仔细 考虑 数据 结构 的 设计 来 实 
现 真 正 的 并 发 存 取 。 一 些 数 据 结构 比 别 的 数据 结构 在 并 发 性 上 有 更 大 的 范围 ， 但 
是 在 所 有 的 情况 下 ， 其 思想 是 一 致 的 ; 更 小 的 保护 区 域 ， 更 少 的 操作 被 序列 化 ， 
以 及 更 高 的 并 发 潜能 。 


在 我 们 考虑 菜 个 数据 结构 设计 前 ， 我 们 移 来 回顾 设计 并 发 性 时 需要 考虑 的 一 
些 简单 准则 。 


为 并 及 设计 数据 结构 的 准则 


就 像 我 提 到 的 ， 为 并 发 存 取 设计 数据 结构 时 ， 你 需要 考虑 两 方面 :保证 存 取 
tz ea "NBI IDSUSUDE MIN NU E 
JZ 原理 。 


。 保证 当 数 据 结构 不 变性 被 别 的 线程 破坏 时 的 状态 不 被 任何 别 的 线程 看 到 。 
。 注意 避免 数据 结构 接口 所 固有 的 竞争 现象 ， 通 过 为 完整 操作 提供 函数 ， 而 不 
是 提供 操作 步 又 。 
。 注意 当 出 现 例 外 时 ， 数 据 结 构 是 怎样 来 保证 不 变性 不 被 破坏 的 。 
y ere CL ready 
9 机 会 。 


在 考虑 这 些 细 节 前 ， 先 考虑 使 用 数据 结构 时 的 限制 条 件 也 是 很 重要 的 ， 如 果 
一 个 函数 通过 特殊 函数 使 用 数据 结构 ， 那 么 其 他 线程 调用 哪个 函数 是 安全 的 ? 


这 是 要 考虑 的 关键 性 问题 。 大 多 数 构造 函数 和 析 构 函数 需要 以 独占 方式 访问 


数据 结构 ， 但 是 需要 使 用 者 保证 它们 在 构造 函数 完成 前 或 者 析 构 函数 开始 后 没有 

被 使 用 。 如 果 数 据 结构 支持 赋值 、swap()、 或 复制 构造 ， 那 么 作为 数据 结构 的 设 

计 者 ， 就 需要 决定 这 些 操 作 与 别 的 操作 同时 被 调用 时 是 否 安全 ， 或 者 是 否 需 要 使 

et E E E 
问题 。 


第 二 个 要 考虑 的 方面 就 是 实现 真正 的 并 发 存 取 。 我 没 办 法 在 这 里 给 出 详尽 的 
准则 ;而 是 ， 这 里 有 一 列 问题 ， 作 为 数据 结构 设计 者 需要 问 问 你 自己 。 


。 锁 的 范围 能 否 被 限定 ， 使 得 一 个 操作 的 一 部 分 可 以 在 锁 外 被 执行 ? 

。 数据 结构 的 不 同 部 分 能 否 被 不 同 的 互 斥 元 保护 ? 

。 是 否 所 有 操作 需要 同样 级 别 的 保护 ? 

© 数据 结构 的 一 个 小 改变 能 否 在 不 影响 操作 语义 情况 下 提高 并 发 性 的 机 会 ? 


所 有 这 些 问 题 都 被 一 个 想法 所 指导 : 如 何 能 够 最 小 化 必然 发 生 的 序列 化 ， 并 
且 能 够 最 大 限度 地 实现 并 发 性 ? 通常 ， 当 多 个 线程 仅仅 读 取 数据 结构 时 可 以 并 发 
访问 此 数据 结构 ， 但 是 一 个 线程 必须 以 独占 方式 修改 数据 结构 。 使 用 构造 函 
数 boost : :shared_mutex 可 以 实现 此 功能 。 而 且 ， 很 快 你 就 会 看 到 ， 数 据 结构 文 
持 执行 不 同 操作 的 线程 和 执行 相同 操作 的 序列 化 线程 并 发 访问 它 。 


最 简单 的 线程 安全 数据 结构 通 间 使 用 互 太 元 和 锁 来 保护 数据 。 就 像 第 3 章 中 
提 到 的 ， 比 较 简 单 的 方式 是 保证 每 次 只 有 一 个 线程 使 用 此 数据 结构 ， 尽 管 这 种 方 
式 也 会 存在 问题 。 为 了 让 你 轻松 了 解 线程 安全 数据 结构 的 设计 ， 本 章 我 们 研究 这 
种 基于 锁 的 数据 结构 ， 在 第 7 章 中 我 们 将 研究 无 锁 的 并 发 数据 结构 的 设计 。 


6.2 FES MNF AUS 


设计 基于 锁 的 并 发 数据 结构 关键 是 要 确保 存 取 数据 时 要 锁 住 正确 的 互 斥 元 ， 
并 且 要 确保 将 锁 的 时 间 最 小 化 。 只 用 一 个 互 斥 元 保护 一 个 数据 结构 是 很 困难 的 。 
你 需要 确保 此 数据 在 互 斥 锁 保 护 区 域 之 外 不 会 被 存 取 ， 并 且 不 会 发 生 接 口 所 固有 
的 竞争 现象 。 如 果 使 用 独立 的 互 斥 元 来 保护 数据 结构 的 独立 部 分 ， 问 题 会 变 得 更 
复杂 ， 并 且 如 果 数 据 结构 上 的 操作 需要 多 个 互 斥 元 被 锁 住 就 有 可 能 产生 死 锁 。 因 
a T E A 
虑 得 更 细致 。 


在 这 部 分 ， 将 6.1.1 节 中 的 准则 运用 到 一 些 简单 数据 结构 的 设计 中 ， 使 用 互 斥 
元 和 锁 来 保护 数据 。 在 不 同 的 情况 下 ， 你 可 以 找到 机 会 在 确保 数据 结构 仍然 线程 
安全 的 情况 下 能 够 有 更 大 的 并 发 性 。 

首先 我 们 回顾 一 下 第 3 半 中 提 到 的 栈 实现 ， 这 大 约 是 最 简单 的 一 种 数据 结 


构 ， 而 且 它 只 是 使 用 了 一 个 互 斥 元 。 它 是 否 真 的 线程 安全 ? 它 距离 实现 真正 的 并 
发 性 到 底 有 多 远 呢 ? 


6.2.1 使 用 锁 的 线程 安全 栈 


在 清单 6.1 中 会 重 现 第 3 章 中 的 线程 安全 栈 。 目 的 是 为 std: :stack<> 写 一 个 相 
似 的 线程 安全 数据 结构 ， 支 持 数 据 入 栈 和 出 栈 。 


清单 6.1 线程 安全 栈 的 类 定义 


#include <exception> 


struct empty stack: std: :exception 


{ 
bi 


template<typename T> 
class threadsafe stack 
{ 
private: 
std::stack<T> data; 
mutable std: :mutex m; 
public: 
threadsafe_stack() {} 
threadsafe stack(const threadsafe_stack& other) 


{ 


const char* whatí) const throw(); 


std::lock quard«std: :mutex> lock (other .ml ; 
data=other.data; 


} 


threadsafe stack& operator=(const threadsafe stack&) 


void push(T new value) 


{ 
Std::lock guard«std::mutex» lock (m); 
data.push(std::move (new value)); <0 

} 

std::shared ptr<T> pop() 

{ 
std::lock_guard<std::mutex> lock (m); 
if(data.empty()) throw empty stack(); -© 
std::shared ptr«T» const res( 

std: :make shared«T»(std::move (data.top()))); 

data.pop(); 
return res; Ò 

} 

void pop(T& value) 

{ 
std::lock guard«std::mutex» lock (m) ; 
if (data.empty()) throw empty stack(); 
value=std: :move (data.top({)); +@ 
data.popí); 

} 

bool empty() const 

{ 
std: : lock guard<std: :mutex> lock (m); 
return data.empty(); 

} 


让 我 们 轮流 看 看 每 个 准则 ， 以 及 它们 是 如 何 应 用 的 。 


= delete; 


首先 ， 如 你 所 见 ， 基 本 的 线程 安全 是 通过 使 用 互 斥 锁 m 保 护 成 员 函 数 来 实现 
的 。 这 就 确保 了 同一 时 间 只 有 一 个 线程 在 存 取 数据 ， 因 此 每 个 成 员 函 数 都 保持 了 


不 变量 ， 没 有 线程 会 看 到 一 个 破坏 的 不 变量 。 


其 次 ，empty() 和 任何 一 个 pop() 函 数 间 都 可 能 产生 竞争 条 件 ， 但 是 当 pop () 
持 有 锁 的 时 候 ， 这 段 代 码 会 明确 地 检查 它 所 包含 的 栈 ， 因 此 竞争 条 件 就 不 成 问题 
了 。 调 用 pop() 时 会 直接 返回 出 栈 的 数据 项 ， 就 避免 了 类 似 于 std: :stack<> 中 单 
独 的 成 员 函 数 top() 和 pop() 间 可 能 产生 的 竞争 条 件 。 


下 一 个 ， 这 里 可 能 会 抛 出 一 些 异 稼 。 锁 住 一 个 互 斥 元 可 能 会 抛 出 异 向 ， 这 不 
仅 古 极其 罕见 的 《因为 这 就 表明 互 斥 元 有 问题 或 者 缺乏 系统 资源 ) ， 也 是 每 个 成 


员 函 数 的 第 一 个 操作 。 因 为 没有 数据 被 修改 ， 所 以 是 安全 的 。 解 锁 一 个 互 斥 元 总 
是 成 功 的 ， 所 以 总 是 安全 的 ， 并 且 使 用 std: : lock_guard<> 保 证 了 在 成 员 函 数 结 
束 的 时 候 互 斥 元 不 会 被 锁定 。 


调用 data.push()@ 可 能 会 殷 出 异常 ， 如 果 复 制 或 者 移动 数据 项 抛 出 异常 或 
者 不 能 分 配 足 够 的 内 存 来 扩展 下 层 的 数据 结构 。 不 管 怎样 ，std: : stack<> 保 证 
了 它 是 安全 的 ， 因 此 这 也 不 是 一 个 问题 。 


在 函数 pop() 重 载 的 第 一 种 形式 中 ， 它 的 代码 可 能 会 抛 出 一 个 empty_stack 
异常 全， 但 是 没有 做 任何 修改 ， 因 此 它 是 安全 的 。 创 建 res 人 时 因为 一 些 原因 可 
能 会 抛 出 异常 : 调用 std: :make_shared 可 能 会 抛 出 异常 ， 因 为 它 无 法 为 新 对 象 
和 需要 引用 计数 的 内 部 数据 分 配 内 存 。 当 复制 构造 函数 或 移动 构造 函数 中 返回 的 
数据 项 被 复制 /移动 到 新 分 配 的 内 存 时 也 可 能 会 抛 出 异常 。 在 这 两 种 情况 下 ， 

C++ 运行 库 和 标准 库 确 保 没 有 内 存 泄露 并 且 新 对 象 〈 如 果 存 在 的 话 ) 被 正确 销 
毁 。 因 为 你 仍然 没有 修改 下 层 的 栈 ， 所 以 没有 问题 。 作 为 结果 的 返回 值 ， 调 
用 data.pop() 全 保证 了 不 会 抛 出 异常 ， 因 此 pop() 的 重 载 是 异常 安全 的 。 


函数 pop() 重 载 的 第 二 种 形式 是 类 似 的 ， 只 不 过 这 次 是 拷贝 赋值 或 移动 赋值 
操作 符 抛 出 异常 @， 而 不 是 构造 新 对 象 和 一 个 std: :shared_ptr 实 例 抛 出 异常 。 
同样 ， 你 实际 上 并 没有 修改 数据 结构 直到 调用 data.pop()@， 这 仍然 保证 了 不 
会 抛 出 异常 ， 因 此 这 一 重 载 也 是 异常 安全 的 。 


最 后 ，empty () 不 修改 任何 数据 ， 因 此 是 异常 安全 的 。 


这 里 会 有 产生 死 锁 的 可 能 ， 因 为 当 持 有 锁 时 调用 了 用 户 代码 : 拷贝 构造 函数 
或 移动 构造 函数 @、 合 ， 以 及 内 含 数据 项 的 拷贝 赋值 操作 或 移动 赋值 操作 人 @， 以 
及 可 能 由 用 户 定义 的 new 操 作 符 。 如 果 当 数据 项 被 插入 栈 或 从 栈 中 移出 时 ， 这 些 
函数 调用 了 栈 的 成 员 函 数 ， 或 者 当 栈 成 员 函 数 被 调用 时 ， 这 些 函 数 请 求 一 个 锁 的 
时 候 保持 着 另 一 个 锁 ， 就 有 可 能 产生 死 锁 。 然 而 ， 要 求 栈 的 使 用 者 做 出 如 下 保证 
是 明智 的 : 你 不 能 理所当然 地 在 没有 复制 数据 项 或 为 之 分 配 内 存 的 情况 下 ， 将 它 
加 入 栈 或 者 从 栈 中 移 走 它 。 


因为 所 有 的 成 员 函 数 都 使 用 std: : lock_guard<> 来 保护 数据 ， 所 以 多 个 线程 
调用 stack 的 成 员 函 数 是 安全 的 。 成 员 函 数 中 只 有 构造 沙 数 和 析 构 函数 是 不 安全 
的 ， 但 是 这 不 是 一 个 特殊 问题 ， 对 象 只 能 被 构造 和 销毁 一 次 。 在 一 个 没有 完全 构 
造 好 的 对 象 或 部 分 析 构 对 象 上 调用 成 员 函 数 永 远 都 不 是 一 个 好 主意 。 因 此 ， 使 用 
者 必须 保证 在 它 被 完全 构造 前 别 的 线程 不 能 存 取 栈 ， 并 且 在 它 被 完全 销毁 前 ， 所 
有 线程 结束 存 取 栈 。 


尽管 对 多 线程 来 次 ， 因 为 使 用 了 锁 ， 每 次 只 有 一 个 线程 对 栈 数据 结构 进行 操 
作 ， 所 以 同时 调用 成 员 函 数 是 安全 的 。 但 是 当 stack 上 存在 显著 的 范 争 时 ， 线 程 
序列 化 可 能 会 限制 应 用 的 性 能 。 当 一 个 线程 在 等 待 锁 的 时 候 ， 它 就 做 不 了 任何 有 
用 的 工作 。 并 且 ， 栈 没有 为 等 待 数据 项 被 插入 的 线程 提供 任何 方式 的 准备 ， 因 此 


如 果 一 个 线程 需要 等 待 ， 它 就 会 反复 地 调用 empty()， 或 者 只 是 调用 pop()， 并 
且 捕 捉 empty_stack 异 常 。 如 果 这 种 情况 发 生 的 话 ， 这 种 栈 实现 就 成 为 一 个 比较 
糟糕 的 选择 ， 因 为 一 个 等 待 中 的 线程 要 么 消耗 宝贵 的 资源 在 检查 数据 上 ， 要 么 用 
户 必 须 写 外 部 的 等 待 和 通知 代码 (比如 ， 使 用 条 件 变 量 ) ， 而 这 就 有 可 能 让 内 部 
锁 变 得 无 效 并 且 造 成 浪费 。 第 4 章 中 的 队列 在 数据 结构 中 使 用 了 条 件 变量 ， 这 就 
提供 了 一 种 数据 结构 中 包含 等 待 的 方法 。 因 此 下 面 我 们 来 看 一 看 。 


6.2.2 ”使 用 锁 和 条 件 变 量 的 线程 安全 队列 


清单 6.2 中 重 现 了 第 4 章 中 提 到 的 线程 安全 队列 。 类 似 于 栈 是 以 std: : stack<> 
建 模 的 ， 队 列 是 以 std: :queue<> 来 建 模 的 。 此 外 ， 它 的 接口 与 标准 容器 适配器 
的 接 2n 同 的 ， 因 为 它 要 满足 其 数据 结构 对 于 来 自 多 线程 的 并 发 访问 是 安全 的 
这 一 约束 。 


清单 6.2 使 用 条 件 变量 的 线程 安全 队列 的 完整 类 定义 


template<typename T> 
class threadsafe queue 
{ 
private: 
Mutable std::mutex mut; 
std::queue<T> data_queue; 
std::condition variable data cond; 
public: 
threadsafe queue () 


Ü 


void push(T new value) 

{ 
Std::lock guard«std::mutex» lk (mut); 
data queue.push(std::move (data)) ; 
data cond.notify one(); 


} 


void wait and pop(T& value) -© 

{ 
std::unique_lock<std::mutex> 1k (mut); 
data_cond.wait (1k, [this] {return !data queue.empty();}); 
value-std::move(data queue.front()); 
data queue.popí); 


Std::shared ptr«T» wait and pop() «9 


Std::unique lock«std::mutex» 1k (mut); 
data_cond.wait (1k, [this] {return !data queue.empty(;]); 
std::shared ptr«T» res ( 


std: :make shared«T»(std::move(data queue.front()))); 


-© 


data queue.pop(); 
return res; 


} 


bool try pop(T& value) 


std::lock_guard<std::mutex> lk(mut); 
if (data_queue.empty ()) 

return false; 
value=std: :move (data_queue.front ()); 
data_queue.pop(); 
return true; 


std::shared_ptr<T> try pop() 


std::lock guard«std::mutex» lkí(mut); 
if (data_queue.empty ()) 
return std: :shared ptr<T>(); +@ 
std::shared ptr<T> res ( 
std: :make shared«T»(std::move(data queue.front()))); 
data queue.pop(); 
return res; 


} 


bool emptyí() const 

{ 
std: : lock guard«std::mutex» 1k (mut) ; 
return data_queue.empty(); 


): 


清单 6.2 中 所 示 的 队列 实现 的 结构 与 清单 6.1 中 所 示 的 栈 的 结构 是 类 似 的 ， 除 
了 push( )@ 中 调用 的 data_cond.notify_one() 以 及 wait_and_pop() 函 数 信 、 
合 。try_pop() 的 两 种 重 载 形式 与 清单 6.1 中 的 pop( ) 函数 的 两 种 重 载 形式 基本 上 
是 相同 的 ， 区 别 在 于 当 队 列 为 空 的 时 候 ，try_pop() 函 数 不 引 发 异 
种 。try_pop() 函 数 要 么 返回 一 个 表明 是 否 取 回 一 个 值 的 boo1 值 ， 要 么 在 返回 指 
针 的 重 载 @ 没 能 取 到 值 的 时 候 返 回 NULL， 这 也 是 实现 栈 的 有 效 方式 。 因 此 ， 如 果 
不 包括 wait_and_pop() 函 数 ， 为 栈 应 用 所 做 的 分 析 同 样 适用 此 。 


新 的 wait_and_pop() 函 数 是 一 种 解决 等 待 队列 入 口 问 题 的 方法 ， 与 反复 调 
用 empty() 函 数 不 同 ， 等 竺 中 的 线程 可 以 通过 调用 wait_and_pop() 函 数 ， 然 后 
数据 结构 使 用 条 件 变量 来 处 理 这 种 等 待 状态 。 对 data_cond .wait() 的 调用 直到 


下 层 队 列 中 人 至少 有 一 个 元 素 时 ， 才 会 返回 ， 因 此 你 不 用 担心 在 代码 的 这 个 地 方 队 
列 为 空 的 可 能 性 ， 数 据 仍然 被 互 斥 元 上 的 锁 保护 着 。 这 些 函 数 不 会 增加 任何 新 的 
苋 争 条 件 和 死 锁 的 可 能 性 ， 并 且 维 持 了 不 变量 。 


当 一 个 元 素 进 入 队列 时 ， 如 果 不 止 一 个 线程 处 于 等 待 状态 ， 关 于 异常 安全 就 
会 有 点 崎 岂 ， 只 有 一 个 线程 会 被 data_cond.notify_one() 的 调用 唤醒 。 然 而 ， 
如 果 被 唤醒 的 线程 在 wait_and_pop() 中 引发 异常 ， 例 如 构 
造 std: :shared_ptr<> 的 时 候 @@， 那 么 就 没有 线程 将 被 唤醒 。 如 果 不 能 接受 这 一 
点 ， 那 么 可 以 用 data_cond .notify al1() 来 代替 data_cond.notify_ one()， 
前 者 将 唤醒 所 有 在 等 待 的 线程 ， 代 价 就 是 当 最 后 它们 发 现 队列 为 空 的 时 候 ， 其 中 
的 大 部 分 线程 都 要 重新 进入 睡眠 状态 。 第 二 种 替代 方法 就 是 ， 当 引发 异常 的 时 
候 ， 让 wait_and_pop() 调 用 notify_one()， 这 样 另 外 一 个 线程 可 以 尝试 获 取 所 
存储 的 值 。 第 三 种 替代 方法 ， 是 将 std: :shared_ptr<> 的 初始 化 移动 到 push( 1) 
调用 ， 并 且 存 储 std: :shared_ptr<> 实 例 而 不 是 直接 存储 值 。 将 内 部 的 
std: :queue<> 复 制 到 std: :shared_ptr<> 并 不 会 引发 异常 ， 因 
此 wait_and_pop() 又 是 安全 的 了 。 清 单 6.3 展 示 了 使 用 这 一 思想 重新 修订 以 后 的 
队列 实现 。 


清单 6.3 包含 std::shared_ptr<> 实 例 的 线程 安全 队列 


template<typename T> 
class threadsafe queue 
{ 
private: 
mutable std::mutex mut; 
std: :queue<std: :shared_ptr<T> > data: queue; 
std::condition_variable data_cond; 
public: 
threadsafe queue {) 


Ü 


void wait and pop(T& value) 

{ 
std: :unique_lock<std::mutex> lk (mut) ; 
data_cond.wait (1k, [this] {return !data queue.empty();]); 
value-std::move(*data queue.frontí)); 
data queue.pop(); Ò 


} 


bool try pop(T& value) 
{ 
std: :lock_guard<std: :mutex> lk(mut); 
if (data_queue.empty ()) 
return false; 
value=std: :move(*data_queue.front ()); -© 
data queue.pop(í); 
return true; 


std::shared ptr«T» wait and pop() 


std::unique lock«std::mutex» lk(mut); 
data_cond.wait (1k, [this] {return !data queue.empty();]); 
std::shared ptr<T> res-data queue.front(); 

data queue.pop(); P 
return res; 


std::shared ptr<T> try Pop 二 
{ 
std::lock guard<std: :mutex> 1k (mut); 
if (data_queue.empty () ) 
return std::shared ptr<T>(); 
std::shared_ptr<T> res-data queue.front(); —0 
data queue.pop(); 
return res; 


j 


void push(T new value) 
{ 
std::shared ptr<T> data ( 
std: :make shared<T>(std: :move (new value) )); < 各 
std::lock quard«std::mutex» lk(mut); 
data_queue.push (data) ; 
data cond.notify one(í); 


} 


bool empty(í() const 

{ 
std::lock guard<std::mutex> 1k (mut) ; 
return data queue.empty(); 


通过 std: :shared_ptr<> 持 有 数据 的 基本 效果 是 直观 的 : 接受 一 个 对 变量 的 
引用 来 获取 新 值 的 pop 函 数 ， 现 在 必须 得 解 引 用 所 存储 的 指针 @@、 四 ， 返 回 一 
25 : shared_ptr<> 实 例 的 pop 函 数 可 以 在 返回 调用 前 从 队列 中 取得 这 个 数 


如 果 数 据 由 std: :shared_ptr<> 持 有 ， 那 么 有 一 个 额外 的 好 处 : 可 以 
在 push() 的 锁 外 面 完 成 此 新 实例 的 分 配 @， 然 而 在 清单 6.2 中 ， 就 必须 在 pop( ) 持 
有 锁 的 情况 下 才能 这 样 做 。 因 为 内 存 分 配 通 常 是 很 昂贵 的 操作 ， 这 种 方式 就 有 助 
a ae came es MTUR 
多 行 操作 。 


就 像 之 前 栈 的 例子 一 样 ， 使 用 互 斥 元 来 保护 整个 数据 结构 限制 了 队列 所 支持 
的 并 发 。 尽 管 多 个 线程 可 能 在 不 同 的 成 员 函 数 中 被 阻塞 ， 但 是 一 次 只 有 一 个 线程 
可 以 进行 操作 。 尽 管 如 此 ， 部 分 限制 来 自 于 在 实现 中 使 用 std: :queue<>; 通过 
使 用 标准 容器 ， 你 基本 上 有 了 一 个 受到 保护 或 者 没 受到 保护 的 数据 项 。 通 过 控制 
数据 结构 的 详细 实现 ， 可 以 提供 更 细 粒 度 的 锁定 ， 并 且 实 现 更 高 级 别 的 并 发 。 


图 6.1 用 单 链表 表示 的 队列 


6.2.3 ”使 用 细 粒 度 锁 和 条 件 变 量 的 线程 安全 队列 


在 清单 6.2 和 清单 6.3 中 ， 有 一 个 被 保护 的 数据 项 (data queue) 和 一 个 互 斥 
元 。 为 了 使 用 细 粒 度 锁 ， 你 需要 瞧 一 瞧 队 列 的 组 成 部 分 ， 并 且 将 一 个 互 斥 元 与 每 
个 不 同 的 数据 项 联系 起 来 。 


实现 队列 最 简单 的 数据 结构 为 单 链表 ， 如 图 6.1 所 示 。 队 列 包含 一 个 头 
(head) 指针 ， 指 向 链表 的 第 一 项 ， 并 且 每 一 项 都 指向 下 一 项 。 将 数据 项 从 队列 
Dad 首先 将 头 指针 指 癌 下 一 个 数据 项 ， 然 后 返回 以 前 头 指 针 所 指 回 的 数据 


数据 项 被 添加 到 队列 的 另 一 端 。 为 了 实现 这 一 点 ， 队列 还 包含 一 个 尾 (tail) 
指针 ， 指 向 链表 的 最 后 一 项 。 通 过 将 最 后 一 项 的 next 指 针 指向 新 结 点 ， 然 后 将 尾 
Po E 一 项 ， 可 以 实现 添加 结 点 。 当 链表 为 空 时 ， 头 指针 和 尾 指针 
NULL 


清单 6.4 展 示 了 这 种 队列 的 简单 实现 ， 基 于 清单 6.2 中 队列 接口 的 缩减 版 本 。 
因为 此 队列 只 支持 单线 程 使 用 ， 因 此 只 需要 一 个 try_pop() 函 数 ， 而 没 
有 wait_and_pop()。 


清单 6.4 一 种 简单 的 单线 程 队 列 实现 


template<typename T> 
class queue 


{ 


private: 
struct node 


{ 


T data; 
std::unique ptr«node» next; 


node(T data ): 
data (std: :move (data )) 
ij 


E: 
std::unique ptr«node» head; +@ 


node* tail; aps 
public: 


queue (} 


ü 


queue (const queue& other) =delete; 
queue& operator- (const queue& other)-delete; 


std::shared ptr«T» try pop() 
{ 
if (!head) 


{ 
} 


std: :shared ptr<T> const res ( 

std: :make_shared<T> (std: :move (head-»data))) ; 
std::unique ptr«node» const old head-std::move (head); 
headzstd::move(old head-»next); “e 


return std::shared ptr«T»(); 


return res; 


} 


void push(T new_value) 

{ 
std: :unique_ptr<node> pínew node (std: :move (new_value) }}; 
node* const new_tail=p.get (); 


if (tail) 
{ 

tail-»next-std::move (p); iQ 
} 
else 
{ 

head=std: :move (p) ; +@ 
} 


tail=new_tail; 0O 
): 


首先 ， 要 注意 清单 6.4 使 用 了 std: :unique_ptr<node> 来 管理 结 点 ， 因 为 这 
可 以 保证 当 结 点 不 再 需要 时 ， 它 们 《以 及 它们 指向 的 数据 ) 能 被 删除 ， 而 无 需 显 
式 地 编写 delete。 所 有 者 链表 从 head 开 始 管理 ， 指 向 最 后 一 个 结 点 的 tail 是 个 
裸 指针 。 


尽管 在 单线 程 环境 中 这 种 实现 方式 可 以 民 好 地 工作 ， 但 是 如 果 在 多 线程 环境 
下 试图 使 用 细 粒 度 锁 ， 就 会 带 来 问题 。 假 定 有 两 个 数据 项 (head@ 和 tai1@) , 
原则 上 可 以 使 用 两 个 互 斥 元 ， 一 个 用 来 保护 nead， 男 一 个 用 来 保护 tail， 但 是 这 
样 会 存在 一 些 问 题 。 


最 明显 的 问题 就 是 ，push() 可 以 修改 head 全 和 tail@， 因 此 它 就 需要 锁 住 


这 两 个 互 斥 元 。 虽 然 倒 竹 ， 但 也 不 是 什么 大 问题 ， 因 为 锁 住 两 个 互 斥 元 是 可 能 
的 。 关 键 的 问题 是 ，push() 和 pop() 都 要 访问 菜 个 结 点 的 next 指 针 。push() 更 
新 tail->next 人 @，try_pop() 读 取 head->next 合 。 如 果 队 列 中 只 有 一 个 结 点 ， 
那么 head==tail， 即 head->next 和 tail->next 是 同一 个 的 对 象 ， 因 而 需要 保 
护 。 因 为 还 没 读 取 head 和 tail 时 ， 你 无 法 分 辨 它们 是 否 为 同一 个 对 象 ， 你 就 必须 
在 push() 和 try_pop() 中 锁定 同一 个 互 斥 元 ， 所 以 没有 比 以 前 做 得 更 好 。 有 没有 
办 法 摆脱 这 一 困境 呢 ? 


1. 通过 分 离 数 据 允 许 并 发 


可 以 通过 预先 分 配 一 个 不 存储 数据 的 倪 候 结 点 ， 以 保证 了 队列 中 总 是 至 少 会 
有 一 个 结 点 ， 将 在 头 尾 的 两 个 访问 分 开 ， 来 解决 这 个 问题 。 对 于 一 个 空 队 
列 ，head 和 tail1 都 指向 这 个 倪 偶 结 点 ， 而 不 是 NULL。 这 样 就 没 问 题 了 ， 因 为 如 
果 当 队列 为 空 ，try_pop() 不 会 访问 head->next。 当 你 将 一 个 结 点 加 入 队列 “〈 于 
是 就 有 一 个 真正 的 结 点 ) ，head 和 tail1 就 指向 不 同 的 结 点 ， 因 此 在 head- >next 
和 tail1->next 上 就 不 存在 竞争 。 缺 点 是 ， 必 须 添加 一 个 额外 的 间接 层 ， 通 过 指 
针 存 储 数 据 ， 以 便 允 许 假 结 点 。 清 单 6.5 展 示 该 实现 现在 的 样子 。 


清单 6.5 使 用 仇 仿 结 点 的 简单 队列 


template<typename T> 
class queue 
{ 
private: 
struct node 
{ 
std: :shared ptr«T» data; 0 
std::unique ptr«node» next; 


E 


std::unique ptr«node» head; 
node* tail; 


public: 
queue(í): 
head (new node),tail(head.get()) O 
Ü 


queue (const queue& other)-delete; 
queue& operator-(const queue& other) =delete; 


std::shared ptr«T» try pop() 

{ 
if (head.get()--tail) -© 
{ 


} 

std::shared ptr«T» const res (head->data) ; 0O 
std::unique ptr«node» old head=std: :move (head); 
head=std: :move (old_head->next) ; O 


return res; < 个 


return std::shared_ptr<T>(); 


} 


void push(T new value) 
{ 
std::shared ptr«T» new data( 

Std::make shared«T»(std::move(new value))); -© 
std::unique ptr<node> p(new node); «— 
tail-»data-new data; 0O 
node* const new tail-p.get(); 
tail-»next-std::move(p); 


tail-new tail; 


对 try_pop() 的 改变 是 很 小 的 。 首 先 ， 是 比较 head 与 tail@@， 而 不 是 检查 其 
是 否 为 NULL， 因 为 倪 偶 结 点 意味 着 head 不 可 能 是 NULL。 因 为 head 是 一 
个 std: :unique_ptrcnode>， 你 需要 调用 head.get() 来 进行 比较 。 其 次 ， 
为 node 现 在 是 通过 指针 来 存储 数据 的 @， 所 以 可 以 直接 获取 指针 全 而 不 必 构 造 T 
的 一 个 新 实例 。 最 大 改变 是 在 push() 中 ， 必 须 在 堆 上 创建 T 的 一 个 新 实例 ， 并 且 
在 std: :shared_ptr<>@ 中 取得 其 所 有 权 (使 用 std: :make_shared 是 为 了 避免 
第 二 次 为 引用 计数 分 配 内 存 的 开销 〉。 你 创建 的 新 结 点 将 会 作为 新 的 仇 偏 结 点 ， 
因此 无 需 向 构造 函数 提供 new_value@@。 取 而 代 之 的 是 ， 将 旧 的 倪 偶 结 点 上 的 数 
据 设 置 为 新 分 配 的 new_value 的 副本 四 最后， 为 了 得 到 一 个 倪 偶 结 点 ， 你 必须 
在 构造 函数 中 创建 它 亿 。 


到 目前 为 止 ， 我 敢 肯定 你 想 知道 这 些 变化 为 你 带 来 了 什么 ， 并 如 何 让 队列 变 
得 线程 安全 。 好 吧 ，push( ) 现 在 只 访问 tail， 不 访问 head， 这 是 一 个 改 
进 。try_pop() 既 访问 head 又 访问 tail， 但 只 要 在 最 初 的 比较 中 需要 tail， 
此 这 个 锁 是 很 短暂 的 。 最 大 的 收获 就 是 ， 仙 候 结 点 意味 着 try_pop() 和 push() 不 
会 在 同一 个 结 点 上 进行 操作 ， 因 此 不 再 需要 一 个 包含 一 切 的 互 斥 元 。 因 此 ， 你 可 
以 为 head 和 tail1 各 设置 一 个 互 斥 元 。 那 锁 应 该 放 在 哪 呢 ? 


我 们 的 目标 是 实现 最 大 程度 的 并 发 ， 因 此 希望 持 有 锁 的 时 间 尽 可 能 的 
短 。push() 比 较 简 单 : 互 斥 元 在 访问 tail 的 全 程 都 需要 被 锁定 ， 这 意味 着 应 该 
在 新 节点 被 分 配 好 之 后 个 以 及 为 当前 的 尾 结 点 分 配 数据 之 前 @@， 锁 定 互 斥 元 。 该 
锁定 需要 一 直 持 有 到 函数 结束 。 


try_pop() 就 没 那么 简单 了 。 首 先 ， 你 需要 锁定 head 上 的 互 斥 元 ， 并 持 有 它 
直到 head 使 用 完毕 。 本 质 上 ， 正 是 这 个 互 斥 元 决定 了 哪个 线程 进行 pop 操 作 。 一 
有 旦 head 改 变 @， 你 就 可 以 解锁 该 互 斥 元 ;在 返回 结果 的 时 候 @， 无 需 锁定 它 。 剩 
下 对 tail1 的 访问 ， 需 要 锁定 尾 互 斥 元 。 因 为 只 需要 访问 tail 一 次 ， 所 以 可 以 只 在 
进行 读 取 的 时 候 获 取 该 互 斥 元 。 最 好 在 将 其 封装 在 函数 内 部 来 实现 。 实 际 上 ， 因 
为 需要 锁定 head 互 斥 元 的 代码 只 是 该 成 员 的 子 集 ， 所 以 将 其 封装 在 函数 里 会 更 清 
晰 。 最 终 的 代码 如 清单 6.6 所 示 。 


清单 6.6 ”使 用 细 粒 度 锁 的 线程 安全 队列 
template<typename T> 
class threadsafe_queue 


private: 
struct node 


std::shared_ptr<T> data; 
std: :unique ptr«node» next; 


}; 


std::mutex head_mutex; 
std::unique ptr«node» head; 
std::mutex tail mutex; 
node* tail; 


node* get tail() 


{ 


std: :lock_guard<std: :mutex> tail_lock(tail_mutex) ; 
return tail; 


std::unique ptr«node» pop head() 
Std::lock guard«std::mutex» head lock(head mutex); 


if (head.get()--get tail()) 


{ 
} 


std: :unique ptr«node» old head-std::move (head); 
head=std: :move (old head-»next); 
return old head; 


return nullptr; 


} 


public: 
threadsafe queue(): 
head (new node),tail(head.get()) 


{} 


threadsafe queue(const threadsafe queue& other)-delete; 
threadsafe queue& operator-(const threadsafe queue& other)-delete; 


std::shared ptr«T» try pop() 
{ 
std: :unique ptr«node» old head-pop head(); 
return old head?old head-»data:std::shared ptr«T»(); 


} 


void push(T new value) 
{ 
std: :Shareq ptr<T> new datal 
std: :make shared<T> (std: :move (new value))); 
std: :unique_ptr<node> pí(new node); 
node* const new tail-p.get(); 
Std::lock guard«std::mutex» tail lock(tail mutex); 
tail->data=new data; 
tail-»next-std::moveíp); 
tail-new tail; 


让 我 们 用 批判 的 眼光 来 分 析 这 段 代 码 ， 思 考 6.1.1 节 中 列 出 的 准则 。 在 寻找 被 
破坏 的 不 变量 前 ， 你 应 该 确定 它们 到 底 是 什么 。 


tail->next==nullptr. 

tail->data==nullptr. 

head==tail 表 明 这 是 一 个 空 链表 。 

只 有 一 个 元 素 的 链表 必须 满足 head- >next==tail。 

对 于 链表 中 的 每 一 个 结 点 x， 当 x!=tail 时 ，x->data 指 向 T 的 一 个 实例 ， 并 
且 x->next 指 向 链表 中 的 下 一 个 结 点 。x->next==tail 表 明 x 是 链表 中 的 最 后 
一 个 结 点 。 

。 从 head 开 始 ， 沿 着 next 结 点 会 最 终 迭 代 到 tail。 


就 其 本 身 而 言 ，push() 是 直观 的 ， 对 数据 结构 所 做 的 唯一 更 改 受 
到 tail_mutex 的 保护 ， 并 且 它 们 维持 了 不 变量 ， 因 为 新 的 尾 结 点 是 一 个 空 结 
点 ， 并 且 data 和 next 已 经 正确 设置 给 旧 的 尾 结 点 了 ， 而 旧 的 尾 结 点 成 为 了 链表 中 
最 后 一 个 真正 的 结 点 。 


try_pop() 这 一 部 分 很 有 趣 。 结 果 证 明了 不 仅 tail_mutex 上 的 锁 对 于 保护 
tail1 本 身 的 读 取 是 必要 的 ， 而 且 确 保 从 头 结 点 读 取 数 据 不 会 产生 数据 竞争 也 是 很 
必要 的 。 如 果 没 有 这 个 互 斥 元 ， 就 有 可 能 出 现 一 个 线程 调用 try_pop() 的 同时 ， 
另 一 个 线程 调用 push()， 而 且 和 它们 的 操作 并 没有 确定 的 顺序 。 尽 管 每 个 成 员 函 数 
在 互 斥 元 上 都 持 有 一 个 锁 ， 但 它们 锁定 的 是 不 同 的 互 斥 元 ， 并 且 可 能 访问 相同 的 
数据 。 毕 竟 ， 队 列 中 的 所 有 数据 都 起 源 于 对 push() 的 调用 。 因 为 线程 都 可 能 会 访 
问 同一 个 数据 而 没有 确定 的 顺序 ， 就 有 可 能 导致 数据 竞争 和 未 定义 的 行为 ， 正 如 
你 在 第 5 章 中 看 到 的 那样 。 幸 亏 在 get_tail() 中 对 tail_mutex 的 锁定 解决 了 一 
切 问 题 。 因 为 调用 get_tail() 与 调用 push() 锁 定 了 相同 的 互 斥 元 ， 在 这 两 次 调 
用 之 间 就 有 了 确定 的 顺序 。 要 么 调用 get_tail() 发 生 在 调用 push() 之 前 ， 这 种 
情况 下 get_tail() 看 到 的 是 tail 的 旧 值 。 要 么 调用 get_tail() 发 生 在 调 
用 push() 之 后 ， 这 种 情况 下 get_tail() 看 到 的 是 tail 的 新 值 ， 并 且 新 的 数据 附 
在 了 tail 之 前 的 值 上 。 


在 锁定 head_mutex 的 情况 下 调用 get_tail() 也 是 很 重要 的 。 如 果 不 这 人 么 
做 ， 对 pop_head() 的 调用 可 能 会 被 阻塞 在 调用 get_tail() 和 锁定 head_mutex 
之 间 ， 因 为 可 能 有 别 的 线程 调用 try_pop() 〈 接 下 来 就 是 pop_head()) ， 并 且 先 
获得 了 锁 ， 从 而 阻止 刚 开始 的 线程 继续 执行 下 去 。 


| 这 是 一 个 有 缺陷 的 
std::unique ptr«node» pop head() <- 实现 e 在 head mutex 的 锁 的 外 
{ 部 获取 旧 的 tail 值 


node* const old tail-get tail(); < 
std::lock guard«std::mutex» head lock(head mutex); 


if(head.get()--old tail) <@ 
{ 


return nullptr; 
} 
std: :unique ptr<node> old_head=std: :move (head) ; 
head-std::move(old head-»next); < 
return old head; P 


在 这 种 损坏 的 情况 下 ， 对 get_tail( ) 的 调用 @ 是 在 锁 的 范围 之 外 做 出 的 ， 
你 可 能 会 发 现在 你 的 初始 线程 能 够 获取 head_mutex 上 的 锁 的 时 候 ，head 和 tail 
都 已 经 发 生 了 变化 ， 并 且 不 仅 返 回 的 尾 结 点 不 仅仅 不 再 是 尾部 ， 甚 至 都 不 再 是 链 
表 的 一 部 分 了 。 这 有 可 能 意味 着 即使 head 真 的 是 最 后 一 个 结 点 ，head 和 
old_tail 的 比较 @ 也 会 失败 。 因 此 ， 当 更 新 head 全 的 时 候 ， 你 可 能 将 head 移 动 
到 tail 之 前 ， 超 过 链表 的 结尾 ， 破 坏 数 据 结构 。 在 清单 6.6 的 正确 实现 中 ， 始 终 保 
持 在 head_mutex() 上 的 锁 的 范围 内 调用 get_tail()。 这 就 确保 没有 别 的 线程 可 
以 改变 head， 并 且 tail 只 会 移 得 更 远 〈 随 着 调用 push() 加 入 新 的 结 点 ) ， 因 此 
是 百 分 百 安全 的 。head 永 远 都 不 会 越过 get_tail() 返 回 的 值 ， 因 而 保持 了 不 变 
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一 旦 pop_head() 通 过 更 新 head， 将 结 点 从 队列 中 删除 ， 互 斥 元 就 解锁 了 ， 
并 且 try_pop() 就 可 以 提取 数据 并 在 有 结 点 的 时 候 将 其 删除 (如 果 没 有 ， 就 返回 
一 个 std: :shared_ptr<> 的 NULL 实 例 ) ， 按 理 说 它 就 是 能 够 访问 该 结 点 的 唯一 
线程 。 


接 下 来 ， 外 部 接口 是 清单 6.2 中 的 程序 的 一 个 子 集 ， 因 此 同样 可 以 分 析 得 到 : 
接口 中 不 存在 固有 的 竞争 条 件 。 


异常 就 更 有 趣 了 。 因 为 改变 了 数据 分 配 模式 ， 因 此 很 多 地 方 都 可 能 产生 异 
常 。try_pop() 的 操作 中 只 有 锁定 互 斥 元 才能 引发 异常 ， 并 且 直 到 它 获 取 锁 之 后 
才 会 修改 数据 。 因 此 try_pop() 是 异常 安全 的 。 男 一 方面 ，push() 在 堆 上 分 配 一 
个 T 的 实例 以 及 一 个 新 的 结 点 实例 ， 而 这 两 者 都 可 能 会 引发 异常 。 不 管 怎样 ， 这 
两 个 新 分 配 的 对 象 都 赋值 给 智能 指针 ， 因 此 当 引 发 异常 时 它们 就 会 被 释放 。 一 旦 
获取 了 锁 ，push() 中 的 其 他 操作 都 不 会 引发 异常 ， 所 以 你 再 次 稳 操 胜 
券 ，push() 也 是 异常 安全 的 。 


因为 没有 改变 接口 ， 所 以 没有 新 的 死 锁 的 外 部 机 会 。 同 样 也 没有 内 部 机 会 ， 
只 有 在 pop_head() 中 才 会 获取 两 个 锁 ， 它 总 是 先 获 取 head_mutex， 然 后 再 获取 
tail_mutex， 所 以 也 不 会 死 锁 。 


剩 下 的 问题 就 是 关于 并 发 的 实际 可 能 性 。 这 种 数据 结构 实际 上 具有 比 清单 6.2 
中 数据 结构 相当 多 的 并 发 范围 ， 因 为 这 些 锁 是 更 细 粒 度 的 ， 并 且 在 锁 外 部 完成 的 
更 多 。 例 如 ， 在 push() 中 ， 分 配 新 结 点 和 新 数据 项 的 是 无 需 持 有 锁 的 。 这 就 意味 
着 多 个 线程 可 以 并 发 地 分 配 新 节点 和 新 数据 项 而 不 会 出 现 问 题 。 每 次 只 有 一 个 线 
程 可 以 在 链表 中 插入 新 结 点 ， 并 且 此 操作 仅仅 是 通过 一 些 简单 的 指针 赋值 来 实现 
的 ， 所 以 与 所 有 内 存 分 配 操作 都 在 std: :queue<> 内 部 的 、 基 于 std: :queue<> 的 
实现 相 比 ， 它 持 有 锁 的 时 间 根 本 就 不 算 多 。 


同样 ，try_pop() 持 有 tail_mutex 的 时 间 也 很 短 ， 以 保护 tail 的 读 取 。 
此 ， 几 乎 整个 对 try_pop() 的 调用 可 以 与 push() 的 调用 同时 发 生 。 同 样 ， 当 持 
有 head_mutex 的 时 候 所 执行 的 操作 是 很 少 的， 昂贵 的 delete 操 作 〈 在 结 点 指针 
的 析 构 函数 中 ) 在 锁 的 外 面 。 这 就 增加 了 同时 发 生 的 调用 try_pop() 的 数量 。 一 
次 只 有 一 个 结 点 可 以 调用 pop_head()， 但 是 多 个 线程 可 以 删除 旧 结 点 并 且 安 全 
地 返回 数据 。 


2. 等 待 一 个 数据 项 pop 


清单 6.6 提 供 了 一 个 使 用 细 粒 度 锁 的 线程 安全 队列 ， 但 它 只 文 持 try_pop() 
并且 只 有 一 种 重 载 ) 。 前 面 清单 6.2 中 的 有 用 的 wait_and_pop() 函 数 呢 ? fea 
用 细 粒 度 锁 实现 相同 的 接口 呢 ? 


当然 ， 回 答 是 肯定 的 ， 但 真正 的 问题 是 ， 怎 么 做 ? 修改 push() 是 很 简单 的 ， 

只 需要 在 函数 的 尾部 添加 data_cond.notify_one() 调 用 即 可 ， 就 如 同 在 清单 6.2 
中 一 样 。 实 际 上 ， 这 并 非 那 么 简单 ， 使 用 细 粒 度 锁 是 为 了 实现 并 发 量 的 最 大 化 。 

如 果 在 对 notify_one() 的 调用 中 保留 互 斥 元 被 锁定 〈 如 同 清单 6.2) ， 那 么 如 果 
被 通知 的 线程 在 互 斥 元 解锁 之 前 被 唤醒 ， 它 就 得 等 待 互 斥 元 。 另 一 方面 ， 假 设 在 
调用 notify_one() 之 前 就 解锁 互 斥 元 ， 那 么 当 等 竺 中 的 线程 被 唤醒 时 ， 此 互 斥 

元 就 可 以 被 它 使 用 〈 假 设 没 有 别 的 线程 先 锁 定 它 ) 。 这 是 一 个 小 小 的 改进 ， 但 某 
些 情况 下 可 能 是 很 重要 的 。 


wait_and_pop() 更 复杂 一 些 ， 因 为 得 决定 在 哪里 等 待 ， 断 言 是 什么 ， 以 及 
需要 锁定 哪个 互 斥 元 。 你 所 等 待 的 条 件 是 “队列 非 空 ”， 它 是 用 head1!=tail1 表 示 
的 。 如 上 所 示 ， 这 有 可 能 要 求 head_mutex 和 tail_mutex 都 被 锁定 ， 但 是 在 清单 
6.6 中 ， 你 已 经 决定 只 需要 在 读 取 tail 的 时 候 锁 住 tail_mutex， 比 较 本 身 是 不 需 
要 的 ， 因 此 可 以 将 相同 的 逻辑 应 用 到 此 人 处。 如果 将 断言 设 定 
为 head!=get_tail()， 就 只 需要 持 有 head_mutex， 因 此 在 调 
用 data_cond.wait() 时 可 以 使 用 head_mutex 上 的 锁 。 一 旦 增加 了 等 待 还 辑 ， 这 
种 实现 就 跟 try_pop() 一 样 了 。 


try_pop() 的 第 二 个 重 载 以 及 相对 应 的 wait_and_pop() 重 载 就 需要 仔细 思 
考 一 下 。 如 果 只 是 将 从 ol1d_head 获 取 到 的 std: : shared_ptr<> 4s ANlAlvalue 
参数 拷贝 赋值 ， 就 可 能 存在 异常 安全 问题 。 此 刻 ， 数 据 项 已 经 从 队列 中 删除 ， 且 
互 斥 元 已 解锁 ， 剩 下 的 就 是 向 调用 者 返回 数据 。 然 而 ， 如 果 找 贝 赋值 引发 异 各 


《这 是 很 有 可 能 发 生 的 ， 数 据 项 就 会 天 失 ， 因 为 无 法 将 基带 回 到 队列 中 同样 的 
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如 果 模 板 参数 中 使 用 的 实际 类 型 T 具 有 不 引发 异常 的 移动 赋值 运算 符 ， 或 是 
不 引发 异常 的 交换 操作 ， 就 可 以 使 用 之 ， 但 是 我 们 实际 上 更 想 要 一 个 适用 于 所 有 
类 型 T 的 通用 解决 方案 。 在 这 种 情况 下 ， 就 需要 在 结 点 从 链表 中 删除 前 ， 将 可 能 
的 异常 引发 移 到 锁 的 范围 内 。 这 就 意味 着 ， 需 要 另外 的 pop_head( ) 重 载 ， 在 修 
改 链表 之 前 获取 存储 的 值 。 


相 比 之 下 ，empty() 就 很 平常 了 ， 只 需要 锁定 head_mutex 并 检查 
head==get_tail()【〔 如 清单 6.10 所 示 ) 。 队 列 最 终 的 代码 如 清单 6.7、 清 单 6.8、 
清单 6.9 和 清单 6.10 所 示 。 


清单 6.7 ”使 用 锁 和 等 待 的 线程 安全 队列 : 内 部 与 接口 


template<typename T> 
class threadsafe queue 
{ 
private: 
struct node 
{ 
std: :shared_ptr<T> data; 
std: :unique_ptr<node> next; 


bit 


std::mutex head mutex; 
std::unique_ptr<node> head; 
std::mutex tail mutex; 
node* tail; 
std::condition variable data cond; 
public: 
threadsafe queue(): 
head (new node),tail(head.get()) 
{} 
threadsafe queue {const threadsafe queue& other) =delete; 
threadsafe queue& operator- (const threadsafe queue& other) =delete; 


std::shared ptr«T» try pop(); 

bool try pop(T& value); 
std::shared ptr«T» wait and pop(); 
void wait and pop(T& value); 

void push(T new value); 

void empty); 


问 队 列 中 入 队 新 结 点 是 很 直观 的 一 一 其 实现 〈 如 清单 6.8 所 示 ) 与 之 前 展示 的 


非常 接近 。 
清单 6.8 ”使 用 锁 和 等 竺 的 线程 安全 队列 : push 新 值 


template<typename T> 
void threadsafe_queue<T>::push(T new value) 


{ 
std::shared ptr«T» new data( 
std::make_shared<T> (std: :move (new_value) )); 
std::unique ptr«node» p(new node); 
{ 
Std::lock guard«std::mutex» tail lock(tail mutex}; 
tail-»data-new data; 
node* const new tail-p.get(); 
tail-»next-std::move (p); 
tail-new tail; 
} 
data cond.notify one(); 
} 


就 像 一 直 提 到 的 那样 ， 复 杂 性 都 在 pop 端 ， 要 利用 一 系列 的 辅助 函数 来 简化 
问题 。 清 单 6.9 展 示 了 wait_and_pop() 是 如 何 实现 的 以 及 相关 的 辅助 函数 。 


清单 6.9 ”使 用 锁 和 等 待 的 线程 安全 队列 : wait and pop() 


template<typename T> 
class threadsafe_queue 


{ 


private: 
node* get_tail() 


{ 


std: :lock_guard<std: :mutex> tail lock(tail mutex); 
return tail; 


std::unique_ptr<node> pop_head() 0 
std: :unique_ptr<node> old_head=std: :move (head) ; 


head-std::move(old head-»next); 
return old head; 


std::unique lock«std::mutex» wait for data() ERE 2) 
Std::unique lock«std::mutex» head lock(head mutex); 


data cond.wait(head lock, [&] {return head.get()!-get tail();]); 
return std::move(head lock); ^e 


Std::unique ptr«node» wait pop head() 


Std::unique lock«std::mutex» head lock(wait for data()); «o 
return pop head(); 


Std::unique ptr«node» wait pop head(T& value) 
Std::unique lock«std::mutex» head lock(wait for data()); -© 
value=std: :move (*head->data); 
return pop head(); 


Std::shared ptr«T» wait and pop() 


Std::unique ptr«node» const old head-wait pop head(); 
return old head-»data; 


void wait and pop(T& value) 


{ 
} 


std: :unique_ptr<node> const old head-wait pop head(value); 
}; 
清单 6.9 所 示 的 pop 端 实现 具有 一 些 辅助 函数 来 简化 代码 和 去 重 ， 例 如 


pop_head()@ 与 wait for _ data() 四 。 相 对 应 地 ， 它 们 修改 链表 以 删除 首 项 ， 

并 且 等 待 队列 中 有 数据 要 pop。wait_for_data() 特 别 值得 一 提 ， 因 为 它 不 仅 使 
用 一 个 lambda 函 数 作为 断言 来 等 待 条 件 变 量 ， 而 且 它 向 调用 者 返回 锁 的 实例 合 。 
这 是 为 了 确保 当 数 据 被 相关 的 wait_pop_head() 重 载 @@、@ 修 改 时 ， 持 有 相同 的 
锁 。 在 清单 6.10 中 列 出 的 try_pop() 代 码 中 也 复 用 了 pop_head()。 


清单 6.10 ”使 用 锁 和 等 待 的 线程 安全 队列 : try_pop0 和 empty0 


template<typename T> 
class threadsafe queue 
{ 
private: 
std::unique ptr«node» try_pop_head() 
{ 
std: :lock_guard<std::mutex> head lock(head mutex); 
if (head.get () ==get_tail()) 
{ 


} 


return pop head (); 


return std: :unique_ptr<node>(} ; 


std::unique ptr«node» try pop head(T& value) 


Std::lock guard«std::mutex» head lock (head mutex); 
if (head.get()--get tailí)) 


{ 
} 


value=std: :move (*head->data) ; 
return pop head(); 


return std::unique ptr«node»(í)]; 


std::shared ptr«T» try pop() 


Std::unique ptr«node» old head=try pop head(); 
return old head?old head-»data:std::shared ptr«T»(); 


bool try pop(T& value) 


{ 


std: :unique ptr<node> const old head-try pop head(value) ; 
return old_head; 


} 


void empty () 


{ 


Std::lock guard«std::mutex» head lock (head mutex) ; 


return (head.getí()--get tail()); 


y; 


这 种 队列 的 实现 将 会 作为 第 7 章 中 提 到 的 无 锁 队 列 的 基础 。 这 是 一 个 无 界 队 
列 。 只 要 还 有 可 用 的 内 存 ， 即 使 没有 值 被 删除 ， 线 程 也 可 以 一 直 往 队 列 中 push 新 
的 值 。 与 无 界 队列 相对 的 是 有 界 队 列 ， 当 队列 被 创建 的 时 候 ， 它 的 最 大 长 度 也 已 
经 定 下 来 了 。 一 旦 一 个 有 界 队列 已 满 ， 再 试图 往 队 列 中 push 更 多 的 元 素 就 会 失败 
或 者 阻塞 ， 直 到 有 元 素 从 队列 中 pop 出 ， 以 腾 出 空间 。 有 界 队 列 对 那些 基于 待 执 
行 的 任务 在 线程 间 划 分 工作 ， 要 确保 均匀 铺 开 工作 的 时 候 ， 是 很 有 用 的 《参见 第 
8 章 ) 。 这 可 以 阻止 线程 过 快 填充 队列 ， 以 至 于 远 远 超过 从 队列 中 读 取 数据 的 线 


程 。 


这 里 展示 的 无 界 队 列 的 实现 可 以 通过 在 push( ) 中 等 每 条 件 变 量 ， 很 容易 地 扩 
展 为 限制 长 度 的 队列 。 不 同 于 等 竺 队列 中 有 数据 项 《例如 在 pop() 中 所 做 的 ) ， 
你 需要 等 待 队列 中 的 项 目 数量 低 于 最 大 值 。 对 有 界 队 列 的 进一步 讨论 超出 了 本 书 
的 范围 。 现 在 ， 让 我 们 越过 队列 ， 来 看 一 看 更 复杂 的 数据 结构 。 
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栈 和 队列 是 很 简单 的 ， 它 们 的 接口 极其 有 限 ， 并 且 紧 紧 关 注 特定 的 目的 。 并 
非 所 有 的 数据 结构 都 是 那么 简单 的 ， 大 部 分 数据 结构 文 持 各 种 操作 。 原 则 上 ， 这 
可 能 导致 更 多 的 并 发 机 会 ， 但 因为 需要 考虑 多 种 访问 模式 ， 使 得 保护 数据 的 任务 
pire E A 
是 ‘J 


为 了 研究 所 涉及 到 的 问题 ， 我 们 先 来 看 看 查找 表 的 设计 。 
6.3.1 编写 一 个 使 用 锁 的 线程 安全 查找 表 


查找 表 或 字典 将 一 种 类 型 〈 键 类 型 ) 的 值 与 男 外 一 种 相同 或 不 同类 型 (映射 
类 型 ) 的 值 联系 起 来 。 一 般 来 说 ， 这 种 数据 结构 的 目的 是 使 代码 可 以 用 一 个 给 定 
的 键 值 来 查询 相关 的 数据 。 在 C++ 标准 库 中 ， 是 通过 使 用 关联 容器 来 实现 这 种 功 
能 的 ， 例 如 ，std: :map<>、std: :multimap<>、std: :unorderedmap<> 以 及 
std::unordered multimap<>. 


查找 表 的 使 用 模式 与 栈 和 队列 都 不 同 。 栈 和 队列 上 的 每 个 操作 都 会 在 一 定 程 
度 上 对 它 有 所 修改 ， 要 么 添加 一 个 元 素 要 么 删除 一 个 元 素 ， 而 查找 表 则 很 少 会 被 
修改 。 清 单 3.13 中 的 简单 DNS 缓存 就 是 这 种 情形 的 一 个 例子 ， 与 std: :map<> 相 
比 ， 它 的 接口 极 大 地 简化 了 。 如 你 在 栈 和 队列 中 看 到 的 ， 当 从 多 个 线程 并 发 访问 
数据 结构 时 ， 标 准 容器 的 接口 并 不 合适 ， 因 为 在 接口 设计 中 存在 固有 的 竞争 条 
件 ， 所 以 它们 需要 被 削减 并 修订 。 


从 并 发 的 角度 来 说 ，std: :map< > 接口 的 最 大 问题 就 是 迭代 器 。 尺 管 当 别 的 
线程 访问 (以 及 修改 ) 容器 时 ， 拥 有 一 个 能 够 安全 访问 容器 的 达 代 器 也 是 有 可 能 
的 ， 但 这 很 灰 手 。 正 确 把 握 迭 代 嚣 要求 你 去 处 理 以 下 的 问题 ， 例 如 男 一 个 线程 正 
在 删除 迭代 器 引用 的 元 素 ， 这 很 及 烦 。 作 为 线程 安全 查找 表 要 砍 掉 的 第 一 个 接 
口 ， 你 应 路 过 迁 代 器 。std: :map<>〔 以 及 标准 库 中 其 他 的 关联 容 絮 〉 的 接口 在 
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查找 表 只 有 一 些 的 基本 操作 。 

添加 新 的 键 / 值 对 。 

改变 与 给 定 的 键 相关 联 的 值 。 
删除 键 及 其 关联 的 值 。 

获得 与 给 定 键 相关 联 的 值 ， 如 果 有 的 话 。 


还 有 一 些 容器 范围 的 操作 也 是 有 用 的 ， 例 如 检查 容器 是 否 为 空 ， 键 的 完整 列 


表 的 快照 ， 或 是 键 / 值 对 的 完整 集合 的 快照 。 


如 果 坚 持 简单 的 线程 安全 准则 ， 例 如 不 返回 引用 ， 以 及 在 每 个 成 员 函 数 上 都 
有 一 个 互 扩 元， 那么 这 些 操作 都 是 安全 的 。 它 们 要 么 出 现在 其 他 线程 的 某 个 修改 
之 前 ， 要 么 在 之 后 。 最 有 可 能 产生 竞争 条 件 的 ， 是 在 添加 一 个 新 的 键 / 值 对 的 时 
候 。 如 果 两 个 线程 添加 一 个 新 值 ， 只 有 一 个 线程 会 胜出 ， 第 二 个 会 因此 而 失败 。 
一 种 可 能 的 方法 将 添加 和 改变 操作 整合 进 单个 成 员 函 数 中 ， 就 像 你 为 清单 3.13 中 
的 DNS 缓存 所 做 的 那样 。 


从 接口 的 角度 来 看 ， 有 趣 一 点 是 获取 相关 联 值 时 的 “如 果 有 ”的 部 分 。 一 种 选 
择 是 当 键 不 存在 的 情况 下 ， 人 允许 用 户 提 供 一 个 “默认 的 ”结果 来 返回 。 


mapped type get value (Key type const& key, mapped type default value); 


在 这 种 情况 下 ， 如 果 没 有 显 式 提 供 default_value， 可 以 使 用 mapped type 
的 默认 构造 函数 实例 。 这 也 可 以 扩展 为 返回 一 
个 std: :pair<mapped_type,bool> 类 型 的 实例 ， 而 不 只 是 mapped_type 的 实 
例 ， 这 里 的 bool 指 示 值 是 否 存 在 。 男 一 种 选择 就 是 ， 返 回 一 个 引用 该 值 的 智能 指 
针 。 如 果 指 针 的 值 为 NULL， 就 是 没有 返回 值 。 


如 上 所 述 ， 一 旦 决定 了 接口 ， 那 么 (假设 没有 接口 竞争 条 件 ) 可 以 通过 在 每 
个 成 员 函 数 中 使 用 一 个 互 斥 元 和 一 个 简单 锁 来 保护 下 层 的 数据 结构 ， 以 保证 线程 
安全 。 然 而 ， 这 会 浪费 通过 独立 的 函数 来 读 取 数 据 结构 并 修改 它 所 提供 的 并 发 可 
能 性 。 一 种 方法 是 使 用 一 个 支持 多 个 读 线程 或 者 一 个 写 线程 的 互 斥 元 ， 例 如 清单 
3.13 中 使 用 的 poost: :shared_mutex。 尽 管 这 种 方法 可 以 提高 并 发 访问 的 可 能 
性 ， 但 是 每 次 只 有 一 个 线程 能 够 修改 数据 结构 。 理 想 情 况 下 ， 你 会 想 要 做 得 更 好 


一 些 。 


设计 一 个 细 粒 度 锁 的 MAP 数 据 结 构 


如 同 在 6.2.3 中 提 到 的 队列 一 样 ， 为 了 人 允许 细 粒 度 锁 ， 你 需要 仔细 考虑 数据 结 
构 的 细节 ， 而 不 是 仅仅 封装 一 个 类 似 于 std: :map<> 这 样 已 存在 容器 。 这 里 通常 
有 三 种 常见 的 方法 来 实现 一 个 类 似 于 查找 表 的 关联 容器 。 


二 叉 树 ， 例 如 红 黑 树 。 
己 排 序数 组 。 
e IX. 


二 又 树 不 能 为 扩大 并 发 机 会 提供 太 多 的 空间 ， 每 次 查找 或 修改 必须 从 访问 根 
节点 开始 ， 因 此 根 节 点 必须 被 锁定 。 尽 管 当 线程 沿 着 树 往 下 移动 的 时 候 会 释放 这 
个 锁 ， 但 是 这 也 不 比 锁定 整个 数据 结构 好 多 少 。 


己 排 序数 组 就 更 糟 了 ， 因 为 无 法 事先 得 知 一 个 给 定 的 数据 在 数组 的 哪个 位 
置 ， 所 以 就 需要 一 次 锁定 整个 数组 。 


只 剩 下 哈 希 表 了 。 假 设 有 一 定数 量 的 桶 ， 一 个 键 属于 哪个 桶 完全 取决 于 这 个 
键 及 其 哈 希 函数 的 特性 。 这 就 意味 着 可 以 安全 地 在 每 个 桶 上 有 一 个 独立 的 锁 。 如 
果 再 次 使 用 支持 多 重读 或 单一 写 的 互 斥 元 ， 你 就 将 并 发 机 会 增加 了 N 重 ， 这 里 的 N 
是 桶 的 数量 。 其 缺点 是 为 键 找 一 个 好 的 哈 希 函 数 。C++ 标 准 库 提 供 了 
std: :hash<> 模 板 ， 可 以 用 来 实现 这 一 目的 。 它 已 经 为 int 等 基本 类 型 以 及 
std: :string 这 样 的 常见 库 类 型 进行 了 特 化 ， 而 且 使 用 者 也 可 以 轻易 地 为 别 的 键 
类 型 将 其 进行 特 化 。 如 果 效 仿 标 准 的 无 序 容 器 ， 以 及 在 进行 哈 希 计算 时 将 函数 对 
象 类 型 作为 模板 参数 ， 那 么 使 用 者 可 以 选择 是 否 为 键 类 型 特 化 std: :hash<>， 或 
是 提供 一 个 单独 的 哈 希 函 数 。 


那么 ， 让 我 们 来 看 清单 6.11 中 的 代码 。 一 个 线程 安全 碍 找 表 的 实现 将 会 是 怎 
样 的 呢 ? 这 里 列 出 了 一 种 可 能 的 实现 。 


清单 6.11 线程 安全 但 找 表 


template<typename Key,typename Value,typename Hash=std: :hash<Key> > 
class threadsafe lookup table 
private: 
class bucket type 
{ 
private: 
typedef std::pair<Key,Value> bucket value; 


typedef std::list<bucket_value> bucket_data; 
typedef typename bucket data::iterator bucket iterator; 


bucket data data; 
mutable boost::shared mutex mutex; +@ 


bucket iterator find entry for(Key const& key) const <@ 
{ 
return std::find if(data.begin(),data.end(), 
[&] (bucket value const& item) 
(return item.first--key;]); 


} 


public: 
Value value for(Key const& key,Value const& default value) const 


{ 


boost::shared lock«boost::shared mutex» lock (mutex) ; +@ 
bucket_iterator const found_entry=find_entry_for (key) ; 
return (found_entry==data.end{))? 


default_value: found_entry->second; 


} 


void add_or_update_mapping(Key const& key, Value const& value) 


{ 
std::unique lock«boost::shared mutex» lock (mutex) ; «o 
bucket iterator const found entry-find entry for(key); 
if (found_entry==data.end()} 


{ 
} 
else 


{ 
} 


data.push_back (bucket_value (key, value) ) ; 


found entry-»second-value; 


) 


void remove mapping(Key const& key) 

{ 
std::unique lock«boost::shared mutex» lock (mutex) ; +@ 
bucket iterator const found_entry=find_entry for (key); 
if(found entry!-data.end()) 


{ 
} 


data.erase(found entry); 


}; 


std: :vector<std::unique ptr«bucket type» > buckets; 0O 
Hash hasher; 


bucket_type& get_bucket (Key const& key) const —9 

{ 
std::size_t const bucket_index=hasher (key)$buckets.size(); 
return *buckets [bucket_index] ; 


} 


public: 
typedef Key key type; 


typedef Value mapped_type; 
typedef Hash hash type; 


threadsafe lookup table ( 
unsigned num_buckets=19,Hash const& hasher -Hash()): 
buckets (num buckets),hasher(hasher ) 


for (unsigned i=0;i<num_buckets;++i) 


{ 
} 


buckets [i] .reset (new bucket type): 


} 


threadsafe lookup table(threadsafe lookup table const& other) =delete; 
threadsafe lookup table& operator-( 
threadsafe lookup table const& other)-delete; 


Value value for(Key const& key, 
Value const& default valueszValue()) const 
{ 


} 


void add or update mapping(Key const& key,Value const& value) 


{ 
} 


void remove mapping(Key const& key) 


{ 
} 


return get bucket (key) .value_for(key,default value); O 


get_bucket (key) .add_or_update_mapping (key, value) ; -© 


get bucket (key) .remove mapping (key) ; «D 
y; 


该 实现 使 用 std: :vector<std: :unique_ptr<bucket_type>>@ 来 持 有 
桶 ， 人 允许 在 构造 函数 中 指定 桶 的 数量 。 默 认 值 是 19， 这 是 一 个 任意 选择 的 质数 。 
哈 希 表 与 质数 数量 的 桶 合作 得 最 好 。 每 个 桶 都 被 一 个 boost : :shared_mutex 的 实 
使 得 每 个 桶 都 可 以 允许 很 多 个 并 发 读 或 者 单个 调用 其 中 一 个 修改 函 


因为 桶 的 数量 是 固定 的 ， 所 以 在 调用 get_bucket() 函 数 @ 时 无 需 锁 定 全 、 
©. O, MAMA Cha TORE EARS CAM) 所 有 权 人 全， 或 是 独占 〈 读 / 
5) 所 有 权 人 @、 合 ， 对 每 个 函数 都 是 适用 的 。 


这 三 个 函数 都 使 用 桶 上 的 find_entry_for() 成 员 函 数 @ 来 确定 在 桶 上 是 否 
有 入 口 。 每 个 桶 包含 一 个 键 / 值 对 的 std: :1ist<>， 因 此 添加 和 删除 项 目 是 很 简单 
的 。 


我 还 关注 了 并 发 的 角度 ， 所 有 的 东西 都 被 互 斥 元 锁 合 适 地 保护 着 ， 那 么 异常 
安全 呢 ? value_for 并 不 修改 任何 东西 ， 所 以 没关系 ;如 果 它 引发 异常 ， 也 不 会 
影响 数据 结构 。remove_mapping 调 用 erase 的 时 候 会 修改 列表 ， 但 是 保证 不 会 引 
发 异常 ， 因 此 是 安全 的 。 只 有 add_or_update_mapping 在 if 的 两 个 分 支 上 可 能 
会 引发 异常 。push_back 是 异常 安全 的 ， 当 它 引 发 异常 时 ， 会 将 列表 留 在 原始 状 
态 ， 因 此 这 个 分 支 是 没 问题 的 。 在 这 种 情况 下 ， 唯 一 的 问题 就 是 当 蔡 换 一 个 现存 
值 时 所 做 的 赋值 ， 如 果 此 赋值 引发 异常 ， 那 么 就 得 指望 它 不 要 修改 原始 值 。 然 
而 ， 这 在 整体 上 并 不 影响 数据 结构 ， 而 且 完 全 是 用 户 提供 类 型 的 属性 ， 因 此 可 以 
安全 地 把 它 留 给 用 户 来 处 理 。 


在 本 节 的 开头 ， 我 提 到 这 种 查找 表 的 一 个 不 错 的 功能 ， 就 是 可 以 获取 到 当前 
状态 的 快照 的 选项 ， 比 如 std: :map<>。 为 了 确保 能 够 得 到 该 状态 的 一 致 的 副 
本 ， 就 需要 锁定 整个 容器 ， 也 就 是 需要 锁定 所 有 的 桶 。 因 为 查找 表 中 “普通 的 ” 操 
作 一 次 只 需要 锁定 一 个 桶 ， 这 束 会 是 唯一 一 个 需要 锁定 所 有 桶 的 操作 。 因 此 ， 只 
要 每 次 按照 相同 的 顺序 例如， 递增 桶 的 索引 〉 来 锁定 桶 ， 就 不 会 有 死 锁 的 机 
会 。 清 单 6.12 给 出 了 一 个 实现 。 


清单 6.12 ”获取 threadsafe_lookup_table 的 内 容 作为 一 个 std::map<> 


std::map«Key,Value» threadsafe lookup table::get_map(}) const 
{ 
std::vector«std::unique lock«boost::shared mutex» > locks; 
for (unsigned i=0;i<buckets.size() ;++i) 
{ 
locks .push_back { 
std: :unique lock<boost::shared_mutex> (buckets [i] .mutex} } ; 
} 
Std::map«Key,Value» res; 
for {unsigned i=0;i<buckets.size() ;++i) 
{ 
for (bucket iterator itzbuckets[i].data.begin(); 
it!=buckets[i].data.end({); 
++it) 


{ 
} 


res.insert(*it); 


j 


return res; 


清单 6.11 中 查找 表 实 现 通 过 单独 锁定 每 个 桶 以 及 使 用 一 
个 boost: :shared_mutex 实 例 来 允许 基于 每 个 桶 的 并 发 读 取 ， 这 就 从 总 体 上 增加 
了 碍 找 表 的 并 发 机 会 。 但 是 如 果 要 通过 更 细 粒 度 的 锁 来 增加 并 发 的 潜力 呢 ? 在 下 
一 节 ， 将 通过 使 用 具有 迭代 器 支持 的 线程 安全 链表 容器 来 实现 。 


6.3.2 ”编写 一 个 使 用 锁 的 线程 安全 链表 


链表 是 一 种 最 基本 的 数据 结构 ， 因 此 它 应 该 能 被 直接 写成 线程 安全 的 ， 不 是 
吗 ? 那么 ， 这 取决 于 你 妃 求 什么 样 的 功能 ， 并 且 需 要 提供 碗 代 器 文 持 ， 这 是 我 
直 避 人 免 将 其 加 入 到 你 的 基础 图 中 的 东西 ， 因 为 它 太 复 淋 了 。STL 风 格 的 迭代 器 文 
持 ， 指 的 是 碗 代 器 必须 持 有 录 种 对 容器 内 部 数据 结构 的 引用 。 如 果 容器 可 以 被 男 
一 个 线程 修改 ， 这 个 引用 必须 仍然 有 效 ， 这 就 从 根本 上 要 求 迭 代 器 在 部 分 数据 结 
构 上 持 有 锁 。 考 虑 到 STL 风 格 的 达 代 器 的 生存 期 是 完全 不 受 容器 控制 的 ， 这 就 不 


是 个 好 主意 。 


男 一 种 方式 是 提供 类 似 于 for_each 这 样 的 迭代 函数 作为 容器 本 里 的 一 部 分 。 
这 就 让 容器 完全 负责 迭代 器 和 锁 ， 但 是 这 与 第 3 和 草 中 提 到 的 避免 死 锁 原则 是 冲突 
的 。 为 了 使 得 for_each 做 一 些 有 用 的 操作 ， 它 就 必须 在 持 有 内 部 锁 的 时 候 调 用 用 
户 提供 的 代码 。 不 仅 如 此 ， 为 了 使 用 户 提供 的 代码 能 够 作用 于 数据 项 ， 它 必须 将 
对 每 个 数据 项 的 引用 传递 给 用 户 提 供 的 代码 。 你 可 以 通过 向 用 尸 提 供 的 代码 传递 
a TEE V Peale stea ees 
源 。 


因此 ， 目 前 我 们 把 它 留 给 用 户 ， 让 他 们 确保 不 会 在 用 户 提 供 的 操作 中 因 获 取 
锁 而 导致 死 锁 ， 并 且 通 过 在 锁 外 的 访问 中 存储 引用 以 避免 导致 数据 竞争 。 束 查找 
表 所 使 用 的 链表 来 说 ， 它 是 完全 安全 的 ， 因 为 不 会 做 任何 不 恰当 的 操作 。 


留 给 你 的 问题 是 ， 要 为 链表 提供 哪些 操作 。 如 果 回 顾 一 下 清单 6.11 以 及 
6.12， 就 可 以 知道 需要 下 列 操作 。 


。 问 链表 添加 新 项 目 。 

。 从 链表 中 删除 满足 一 定 条 件 的 项 目 。 
。 在 链表 中 得 找 满足 一 定 条 件 的 项 目 。 
。 更 新 满足 一 定 条 件 的 项 目 。 

。 复制 链表 中 每 个 项 目 到 另 一 个 容器 中 。 


为 了 令 其 成 为 民 好 的 通用 链表 容器 ， 添 加 进一步 的 操作 例如 在 指定 位 置 插 入 
是 很 有 用 的 ， 但 是 对 于 查找 表 是 不 需要 的 ， 因 此 我 将 它 留 给 读者 作为 练习 。 


在 链表 中 使 用 细 粒 度 锁 的 基本 思想 是 每 个 结 点 使 用 一 个 互 扩 元。 如 果 链 表 很 
大 ， 就 会 有 很 多 互 斥 元 ! 其 好 处 就 是 在 链表 不 同 部 分 的 操作 是 真正 并 发 的 。 每 个 
操作 仅 在 其 真正 关注 的 结 点 上 持 有 锁 ， 并 且 当 它 移 动 到 下 一 个 结 点 时 ， 会 解锁 每 
个 结 点 。 清 单 6.13 给 出 了 正 是 这 样 一 个 链表 的 实现 。 


清单 6.13 ”支持 迭代 的 线程 安全 链表 


template«typename T» 
class threadsafe list 


{ 
struct node 0 
{ 
std::mutex m; 
std: :shared_ptr<T> data; 
Std::unique ptr«node» next; 


node () : < 二 分 


next () 


i E 
node (T const& value): 


data(std::make shared«T»(value)) 
{} 


} 
node head; 


public: 
threadsafe list () 


{} 


~threadsafe_list() 


{ 
} 


threadsafe list(threadsafe list const& other) =delete; 
threadsafe list& operator=(threadsafe list const& other) =delete; 


remove if([] (node const&) {return true; }); 


void push front(T const& value) 

{ 
std: :unique ptr«node» new node (new node (value) ) ; «Oo 
Std::lock guard«std::mutex» lk(head.m); 
new node-»nextsstd: :move (head.next); «— 
head.next-std::move(new node); 

6 


template<typename Function> 

void for_each (Function £f) «9 

{ 
node* currentz&head; 
std::unique lock«std::mutex» lk(head.m); -© 
while (node* const next-current-»next.get ()) -© 


{ 


std: :unique_lock<std: :mutex> next lkínext-»m); «D 


lk.unlock(); 

f(*next-»data); «p “o 
current=next ; 

lk-std::move(next lk); «p 


} 


template<typename Predicate> 
std::shared_ptr<T> find_first_if (Predicate p) «D 


node* current=&head; 
Std::unique lock<std::mutex> lk (head.m) ; 
while (node* const next=current->next.get()) 


{ 


std: :unique_lock<std: :mutex> next lkí(next-»m); 


lk. unlock (}; 
if (p (*next - >data) ) «D 
{ 
return next-»data; «—D 


) 


current-next; 
lk=std: :move (next_1k) ; 

} 

return std::shared ptr«T»(); 


} 


template<typename Predicate> 

void remove_if (Predicate p) + 

{ 
node* current=&head; 
std::unique_lock<std::mutex> 1k (head.m) ; 
while (node* const next-current-»next.get()) 


{ 


std: :unique_ lock<std::mutex> next lk (next->m) ; 


if (p(*next->data) ) +H 
std::unique ptr«node» old next-std::move(current-»next); 
current ->next=std: :move (next-»next); x-«Dp 


next lk.unlock(); 


) 


else 


{ 
lk.unlock(); A 


current=next; 
lkzstd::move(next lk); 


清单 6.13 中 的 threadsafe_1ist<> 是 一 个 单 链 表 ， 每 个 入 口 是 一 个 node 结 构 
体 @。 默 认 构 造 的 node 是 链表 的 head， 开 始 时 它 的 next 指 针 为 NULL@。 新 结 点 
是 通过 push_front() 函 数 增加 的 ， 首 先 构造 一 个 新 结 点 个 ， 在 堆 上 分 配 存储 的 
数据 四， 保留 next 指 针 为 NULL。 然 后 你 需要 为 head 结 点 获取 互 斥 元 上 的 锁 来 得 
到 正确 的 next 值 人 ， 并 且 通 过 将 head.next 设 置 为 指向 新 结 点 来 实现 将 这 个 结 点 
插入 链表 前 方 @。 到 目前 为 止 ， 一切 都 还 不 错 ， 你 只 需要 锁 住 一 个 互 斥 元 来 将 新 
项 目 插入 链表 ， 因 此 没有 死 锁 的 风险 。 同 样 ， 绥 慢 的 内 存 分 配 发 生 在 锁 之 外 ， 
此 锁 只 保护 几 个 指针 值 的 更 新 并 且 不 会 失败 。 下 面 是 迭代 函数 。 


首先 ， 我 们 来 看 看 for_each()@@。 这 个 操作 用 接受 某 种 类 型 的 Function， 
作用 于 表 中 的 每 一 个 元 素 ; 通常 在 大 多 数 标准 库 中 ， 它 会 通过 值 形 式 接 受 此 函 
数 ， 并 且 可 以 与 真正 的 函数 或 者 是 具有 函数 调用 操作 符 的 某 种 类 型 的 对 象 一 起 运 
作 。 在 这 种 情况 下 ， 函 数 必须 接受 类 型 为 T 的 值 作为 唯一 的 参数 。 这 就 是 你 进行 
交 蔡 锁定 的 地 方 。 刚 开始 ， 你 锁定 head 结 点 上 的 互 斥 元 候 。 然 后 就 可 以 安全 地 获 
得 指向 next 结 点 的 指针 (使 用 get( ) 因 为 你 并 不 打算 获取 该 指针 的 所 有 权 〉 。 如 
果 该 指针 不 为 NULL@， 就 锁定 那个 结 点 上 的 互 斥 元 OO 来 处 理 数据 。 一 旦 你 锁定 那 
个 结 点 ， 就 可 以 释放 之 前 结 点 的 锁 @， 并 且 调 用 指定 的 函数 @ 罗 。 一 旦 函数 完成 ， 
就 可 以 更 新 current 指 针 指 向 你 刚刚 处 理 的 结 点 ， 并 且 将 锁 的 拥有 权 从 next_Lk 
移动 (move) 到 1k@ 鸭 。 因 为 for _each 将 每 个 数据 项 直接 传递 给 所 提供 的 
Function， 如 果 需 要 的 话 ， 你 可 以 使 用 它 更 新 数据 项 或 者 将 它们 复制 到 另 一 个 容 
器 中 ， 或 其 他 任何 事情 。 如 果 函 数 表现 良好 这 就 是 安全 的 ， 因 为 拥有 数据 项 的 结 
点 在 整个 调用 中 都 持 有 互 斥 元 。 


find first if()(B for _each() 是 类 似 的 ， 最 主要 的 不 同 之 处 在 于 提供 
的 Predicate 必 须 返 回 true 来 表明 找到 了 匹配 项 或 者 false 来 表明 没 找到 匹配 项 
全 .一 旦 你 找到 匹配 项 ， 你 就 返回 找到 的 数据 @ 而 不 是 继续 查找 。 你 可 以 
用 for_each() 来 实现 它 ， 但 是 一 旦 找到 匹配 项 就 不 需要 继续 处 理 链表 中 剩 下 的 


部 分 了 。 


remove_if() 信 有些 不 同 ， 因 为 这 个 函数 必须 真正 地 更 新 链表 ， 你 不 能 
用 for_each( ) 来 实现 它 。 如 果 Predicate 返 回 true@@， 你 就 通过 更 新 current- 
>next@ 力 将 这 个 结 点 从 链表 中 删除 。 一 旦 完成 ， 就 可 以 释放 next 结 点 互 斥 元 所 持 
有 的 锁 。 当 你 将 它 移入 的 std: :unique_ptrcnode> 超 出 范围 时 ， 该 结 点 就 被 删 
除了 加 .在 这 种 情况 下 ， 你 不 用 更 新 current， 因 为 需要 检查 新 的 next 结 点 。 如 
果 Predicate 返 回 false， 你 就 像 以 前 一 样 处 理 @。 


那么 ， 这 些 互 斥 元 上 存在 着 死 锁 或 者 竞争 条 件 么 ? 答案 毫 无 疑问 是 否定 的 ， 
前 提 是 所 提供 的 断言 和 函数 是 表现 良好 的 。 和 迭代 总 是 按照 同一 方式 ， 通 常 从 head 
结 点 开始 ， 并 且 总 是 在 释放 当前 互 斥 元 前 就 锁 住 下 一 个 互 斥 元 ， 因 此 不 可 能 在 不 
同 的 线程 间 有 不 同 的 锁 顺 序 。 唯 一 可 能 产生 竞争 条 件 的 ， 就 是 在 remove_if() 中 
对 待 删 除 结 点 的 删除 ， 因 为 你 会 在 解锁 互 斥 元 之 后 才 这 么 做 〈 销 毁 一 个 锁定 的 互 
斥 元 是 未 定义 的 行为 ) 。 然 而 ， 稍 加 思考 就 会 知道 这 确实 是 安全 的 ， 因 为 你 仍然 
持 有 之 前 结 点 (current) 上 的 互 斥 元 ， 因 此 没有 新 线程 可 以 试图 获取 你 要 删除 
的 结 点 上 的 锁 。 


并 发 的 机 会 又 如 何 呢 ? 这 种 细 粒 度 锁 的 关键 是 在 单个 互 斥 元 上 提高 并 发 的 可 
能 性 ， 那 么 实现 这 一 点 了 么 ? 是 的 ， 已 经 实现 了 。 不 同 的 线程 可 以 同时 在 链表 的 
不 同 结 点 上 工作 ， 无 论 它 们 正在 用 for_each() 处 理 每 个 数据 项 ， 还 
用 find_ first_if() 搜 索 ， 还 是 用 remove_if() 来 删除 项 目 园 。 但 是 因为 每 个 结 
点 的 互 斥 元 轮流 被 锁定 ， 线 程 不 能 互相 超越 。 如 果 一 个 线程 花 了 很 长 时 间 处 理 一 
个 特定 的 结 点 ， 当 别 的 线程 到 达 此 特定 结 点 时 就 必须 等 待 。 


6.4 ”小 结 


本 章 开 头 考 虑 了 为 并 发 设计 一 个 数据 结构 意味 着 什么 ， 并 且 提 供 了 一 些 准则 
来 实现 。 然 后 我 们 完成 一 些 通 用 的 数据 结构 《〈 栈 、 队 列 、 哈 希 映 射 以 及 链表 ) ， 
考虑 了 如 何在 设计 并 发 存 取 的 时 候 应 用 这 些 准 则 来 实现 它们 ， 使 用 锁 来 保护 数据 
并 阻止 数据 竞争 。 现 在 你 可 以 考虑 设计 你 自己 的 数据 结构 ， 观 察 哪里 有 并 发 的 机 
会 以 及 哪里 可 能 会 存在 竞争 条 件 。 


在 第 7 章 ， 我 们 将 看 一 看 完全 避免 锁 的 方法 ， 使 用 底层 原子 操作 来 提供 必要 
的 顺序 限制 ， 并 且 遵 循 同样 的 准则 。 


第 7 重 ” 设 计 无 锁 的 并 及 数据 结构 
本 章 主要 内 容 


e 为 无 需 使 用 锁 的 并 发 而 设计 的 数据 结构 的 实现 
。 在 无 锁 数 据 结构 中 管理 内 存 的 技术 
。 有 助 于 编写 无 锁 数据 结构 的 简单 准则 


上 一 重 中 ， 我 们 分 析 了 为 实现 并 发 性 设计 数据 结构 时 需要 考虑 的 一 般 方 面 ， 
考虑 了 这 种 设计 确保 安全 的 准则 。 然 后 ， 我 们 验证 了 几 种 第 见 的 数据 结构 ， 并 且 
分 析 了 使 用 互 斥 元 和 锁 来 保护 共享 数据 的 实现 的 例子 。 在 前 面 的 几 个 例子 中 ， 使 
用 一 个 互 斥 元 来 保护 整个 数据 结构 。 在 后 面 的 几 个 例子 中 ， 使 用 多 个 互 斥 元 来 保 
护 数 据 结 构 的 多 个 小 部 分 ， 并 且 在 访问 数据 结构 时 允许 了 更 大 级 别 的 并 发 。 


互 斥 元 是 保证 多 个 线程 可 以 安全 访问 数据 结构 ， 而 不 会 遇 到 竞争 条 件 和 破坏 
不 变量 的 有 效 机 制 。 在 探讨 使 用 它们 的 代码 的 行为 时 也 相对 较 简 单 ， 代 码 要 么 让 
保护 数据 的 互 斥 元 锁定 ， 要 么 就 不 这 样 。 然 而 ， 这 也 并 不 全 然 那么 好 。 第 3 章 
中 ， 看 到 了 锁 的 不 当 使 用 会 如 何 导 致死 锁 ， 并 且 在 基于 锁 的 队列 和 得 找 表 的 例子 
中 ， 可 以 看 出 锁 的 粒度 是 如 何 影 响 真 正 并 发 的 潜能 。 如 果 能 设计 出 不 使 用 锁 就 能 
和 
Zu £n TA) o 


在 本 章 中 ， 我 们 将 考虑 如 何 将 第 5 草 中 提 到 的 原子 操作 的 内 存 顺 序 特性 应 用 
到 无 锁 数 据 结构 的 构造 中 。 设 计 这 种 数据 结构 时 需要 特别 小 心 ， 因 为 很 难 做 得 正 
确 ， 并 且 导 致 设计 失败 的 条 件 可 能 很 少 发 生 。 首 先 ， 我 们 来 了 解数 据 结构 无 锁 的 
ET 
准则 。 


7.1 定义 和 结 


使 用 互 斥 元 、 条 件 变量 以 及 future 来 同步 数据 的 算法 和 数据 结构 被 称 为 阻塞 
(blocking) 的 算法 和 数据 结构 。 调 用 库 函 数 的 应 用 会 中 断 一 个 线程 的 执行 ， 直 
到 男 一 个 线程 执行 一 个 动作 。 这 种 库 函 数 调用 被 称 为 阻塞 调用 ， 因 为 直到 阻塞 被 
释放 时 线程 才能 继续 执行 下 去 。 通 常 ， 操 作 系统 会 完全 阻塞 一 个 线程 《并 且 将 这 
个 线程 的 时 间 片 分 配给 男 一 个 线程 》 直 到 男 一 个 线程 执行 了 适当 的 动作 将 其 解 
锁 ， 可 以 是 解锁 互 斥 元 、 通 知 条 件 变 量 或 者 使 得 future 就 绪 。 

不 使 用 阻塞 库 函 数 的 数据 结构 和 算法 被 称 为 非 阻 窒 Cnonblocking) 的 。 但 


是 ， 并 不 是 所 有 这 样 的 数据 结构 都 是 无 锁 (lock-free〉 的 ， 因 此 我 们 来 看 一 看 非 
阻塞 数据 结构 的 各 种 类 型 。 


7.1.1 非 阻 塞 数据 结构 的 类 型 


第 5 章 中 ， 我 们 实现 了 一 种 使 用 std: :atomic flag 作 为 自 旋 锁 的 基本 互 斥 
元 。 清 单 7.1 中 复 刻 了 该 代码 。 


清单 7.1 使 用 std::atomic flag 的 自 旋 锁 互 斥 元 的 实现 


class spinlock mutex 


{ 
std::atomic flag flag; 
public: 
spinlock_mutex(): 
flag (ATOMIC FLAG INIT) 
Ü 


void lock() 


{ 
} 
void unlock () 


{ 
} 


while (flag.test and set (std::memory order acquire)); 


Llag.clear(std::memory order release); 


这 段 代 码 不 调用 任何 阻塞 函数 ，lock() 一 直 循 环 直到 对 test_and_set() 的 
调用 返回 false。 这 就 是 自 旋 锁 (spinlock) 名 称 的 由 来 一 一 代码 围绕 着 循环 * 旋 
转 ”。 无 论 如 何 ， 这 里 没有 阻塞 调用 ， 因 此 任何 使 用 此 互 斥 元 来 保护 共享 数据 的 代 


码 因而 都 是 非 阻塞 的 。 然 而 ， 它 并 非 无 锁 的 。 它 仍然 是 一 个 互 斥 元 ， 并 且 一 次 仍 
然 只 能 被 一 个 线程 锁定 。 我 们 来 看 看 无 锁 的 定义 ， 这 样 就 能 明白 哪些 类 型 的 数据 
结构 是 被 涉及 的 。 


7.1.2 无 锁 数 据 结构 


对 于 有 资格 称 为 无 锁 的 数据 结构 ， 就 必须 能 够 让 多 于 一 个 线程 可 以 并 发 地 访 
问 此 数据 结构 。 这 些 线程 不 需要 做 相同 的 操作 ， 无 锁 队 列 可 以 允许 一 个 线程 push 
的 同时 另 一 个 线程 pop， 但 是 如 果 两 个 线程 同时 试图 插 push 新 数据 项 的 时 候 ， 就 会 
打破 无 锁 队 列 。 不 仅 如 此 ， 如 果 一 个 访问 数据 结构 的 线程 在 操作 中 途 被 调度 器 挂 
起 的 话 ， 别 的 线程 必须 仍然 能 够 完成 操作 而 无 需 等 待 挂 起 的 线程 。 


在 数据 结构 上 使 用 比较 /交换 操作 的 算法 经 常 在 其 中 包含 循环 。 使 用 比较 / 交 
换 操作 是 因为 有 可 能 男 一 个 线程 正在 同时 修改 数据 ， 这 种 情况 下 ， 代 码 就 需要 在 
试图 重新 比较 /交换 前 重 做 部 分 操作 。 如 果 比 较 / 交 换 操作 最 终 在 其 他 线程 都 被 中 
断 的 情况 下 成 功 ， 那 么 这 种 代码 仍然 是 无 锁 的 。 如 果 没 有 ， 最 起 码 要 使 用 自 旋 
锁 ， 是 非 阻塞 的 而 不 是 无 锁 的 。 


具有 这 种 循环 的 无 锁 算 法 可 能 会 导致 一 个 线程 承受 饥饿 。 如 果 另 一 个 线程 
在 “错误 的 "时间 执 行 操作 ， 那 么 当 第 一 个 线程 持续 重 试 其 操作 时 ， 别 的 线程 则 可 
以 继续 前 进 。 能 够 避免 此 类 问题 的 数据 结构 是 无 等 待 ， 也 是 无 锁 的 。 


7.1.3 ”无 等 得 的 数据 结构 


无 等 待 的 数据 结构 是 一 种 无 锁 的 数据 结构 ， 并 且 有 着 额外 的 特性 ， 每 个 访问 
数据 结构 的 线程 都 可 以 在 有 限 数量 的 步骤 内 完成 它 的 操作 ， 而 不 用 管 别 的 线程 的 
行为 。 因 为 其 他 线程 的 冲突 而 可 能 卷 入 无 限 次 重 试 的 算法 不 是 无 等 竺 的 。 


正确 地 编写 无 等 待 的 数据 结构 是 极其 困难 的 。 为 了 确保 每 个 线程 都 能 够 在 有 
限 步 又 内 完成 它 的 操作 ， 就 必须 保证 每 个 操作 都 可 以 在 一 个 操作 周期 内 执行 ， 并 
且 一 个 线程 执行 的 操作 不 会 导致 另 一 个 线程 上 操作 的 失败 。 这 会 使 得 各 种 操作 的 
整体 算法 变 得 相当 复杂 。 


鉴于 正确 地 设计 无 锁 或 无 等 竺 数据 结构 是 如 此 困难 ， 你 需要 一 些 很 好 的 理由 
和 


7.1.4 无 锁 数据 结构 的 优点 与 缺点 


到 了 这 一 步 ， 使 用 无 锁 数据 结构 的 最 主要 的 原因 就 是 为 了 实现 最 大 程度 的 并 
发 。 对 于 基于 锁 的 容器 ， 总 是 有 可 能 一 个 线程 必须 阻塞 ， 并 在 可 以 继续 前 等 待 忆 
一 个 线程 完成 其 操作 。 互 斥 元 锁 的 目的 就 是 通过 互 斥 来 阻止 并 发 。 使 用 无 锁 数 据 


结构 时 ， 茶 些 线程 一 步 步 地 执行 操作 。 使 用 无 等 待 数据 结构 时 ， 不 管 别 的 线程 在 
做 什么 操作 ， 每 个 线程 都 可 以 继续 执行 而 不 需要 等 待 。 这 是 一 种 很 希望 得 到 但 是 
却 很 难得 到 的 特性 。 都 很 容易 在 编写 基本 的 一 个 自 旋 锁 时 告终 。 


使 用 无 锁 数据 结构 的 第 二 个 原因 是 健壮 性 。 当 一 个 线程 在 持 有 锁 的 时 候 终 
止 ， 那 个 数据 结构 就 永远 被 破坏 了 。 但 是 如 果 一 个 线程 在 操作 无 锁 数据 结构 时 终 
止 了 ， 就 不 会 丢失 任何 数据 ， 除 了 此 线程 的 数据 之 外 ， 其 他 线程 可 以 继续 正常 执 
i. 


男 一 方面 ， 如 果 不 能 排除 线程 访问 数据 结构 ， 那 么 就 必须 确保 持 有 不 变量 或 
选择 可 以 持 有 的 蔡 代 的 不 变量 。 并 且 ， 必 须 注意 你 加 于 操作 上 的 顺序 限制 。 为 了 
避免 与 数据 竞争 有 关 的 未 定义 行为 ， 你 就 必须 在 修改 时 使 用 原子 操作 。 仅 仅 如 此 
还 是 不 够 的 ， 你 必须 确保 这 个 改变 以 正确 的 顺序 对 其 他 线程 是 可 见 的 。 所 有 这 些 
都 意味 着 设计 线程 安全 数据 结构 时 ， 不 使 用 锁 比 使 用 锁 要 困难 的 多 。 


因为 不 使 用 任何 锁 ， 因 此 无 锁 数 据 结构 是 不 会 发 生死 锁 的 ， 尺 管 有 可 能 存在 
活 锁 。 当 两 个 线程 都 试图 修改 数据 结构 ， 但 是 对 于 每 个 线程 来 说 ， 必 一 个 线程 所 
做 的 修改 都 会 要 求 此 线程 的 操作 重新 被 执行 ， 因 此 这 两 个 线程 都 会 一 直 循环 和 不 
条 答 试 ， 在 这 种 情况 下 就 会 发 生活 锁 。 除 非 茶 个 线程 先 到 达 《〈 通 过 协议 ， 通 过 更 
快 ， 或 完全 靠 运气 ) ， 不 然 此 循环 会 一 直 继 续 下 去 。 在 这 个 简单 的 例子 中 ， 活 锁 
通常 是 短暂 的 ， 因 为 它们 取决 于 线程 的 精确 调度 。 因 此 ， 活 锁 会 降低 性 能 而 不 会 
导致 长 期 的 问题 ， 但 是 也 是 需要 注意 的 事情 。 根 据 定义 ， 无 等 待 的 代码 无 法 忍受 
活 锁 ， 因 为 它 执行 操作 的 步骤 数 通常 是 有 上 限 的 。 另 一 方面 ， 这 种 算法 比 别 的 算 
法 更 复杂 ， 并 且 即 使 当 没 有 线程 存 取 数 据 结构 的 时 候 也 需要 执行 更 多 的 步骤 。 


这 就 种 来 了 无 锁 和 无 等 竺 代码 的 男 一 个 缺点 ， 尺 管 它 可 以 增加 在 数据 结构 上 
操作 的 并 发 能 力 ， 并 且 减 少 了 线程 等 待 的 时 间 ， 但 是 它 可 能 降低 整体 的 性 能 。 首 
先 ， 无 锁 代码 使 用 的 原子 操作 可 能 比 非 原子 操作 要 慢 很 多 。 并 且 与 基于 锁 数据 结 
构 的 互 斥 元 锁 代 码 相 比 ， 无 锁 数 据 结构 中 需要 更 多 的 原子 操作 。 不 仅 如 此 ， 硬 件 
必须 在 存 取 同 样 的 原子 变量 的 线程 间 同 步 数 据 。 正 如 你 将 在 第 8 章 中 看 到 的 ， 与 
多 个 线程 存 取 同 样 的 原子 变量 相关 的 兵 乓 绥 存 可 能 会 成 为 一 种 显著 的 性 能 消耗 。 
总 而 言 之 ， 在 选择 任何 一 种 方式 前 ， 检 查 基 于 锁 的 数据 结构 和 无 锁 数据 结构 的 相 
关 性 能 方面 〈 是 否 为 最 坏 等 待 时 间 ， 平 均等 待 时 间 ， 总 的 执行 时 间 ， 或 其 他 方 
HD 是 很 重要 的 。 


下 面 我 们 来 看 一 些 例 子 。 


7.2 无 锁 数 据 结构 的 例子 


为 了 展示 在 设计 无 锁 数 据 结构 时 使 用 的 一 些 技术 ， 我 们 来 看 一 些 简单 数据 结 
构 的 无 锁 实 现 。 我 们 不 仅 举 例子 描述 了 一 系列 有 用 的 数据 结构 的 实现 ， 而 且 将 举 
例子 强调 无 锁 数据 结构 设计 中 比较 特殊 的 部 分 。 


就 像 之 前 提 到 的 ， 依 赖 于 使 用 原子 操作 的 无 锁 数据 结构 ， 以 及 与 之 相关 联 的 
内 存 顺序 保证 是 为 了 确保 数据 以 正确 的 顺序 对 其 他 线程 可 见 。 起 初 ， 我 们 为 所 有 
原子 操作 都 使 用 默认 的 memory_order_seq_cst 内 存 顺序 ， 因 为 这 是 最 简单 的 
( 记 住 所 有 的 memory_order_seq_cst 操 作 构 成 了 全 局 顺序 ) 。 但 是 在 后 来 的 例 
子 中 ， 我 们 考虑 降低 一 些 排 序 约束 
到 memory_ order acquire. memory order_release， 甚 至 
memory order_relaxed 中 。 尽 管 在 这 些 例子 中 都 未 直接 使 用 互 斥 元 锁 ， 但 是 需 
要 记 住 的 是 ， 只 有 std: :atomic_flag 保 证 在 实现 中 是 不 使 用 锁 的 。 在 一 些 平台 
上 ， 有 些 看 上 去 无 锁 的 代码 ， 实 际 上 却 可 能 使 用 了 C++ 标准 库 实 现 的 内 部 锁 〈 参 
见 第 5 瘟 ) 。 在 这 些 平 台 上 ， 一 个 简单 的 基于 锁 的 数据 结构 可 能 更 适合 。 但 是 还 
有 比 这 更 重要 的 是 ， 在 选择 一 种 实现 的 时 候 ， 必 须 先 确定 你 的 要 求 ， 然 后 考虑 有 
哪些 选择 可 以 满足 此 要 求 。 


因此 ， 我 们 追溯 到 一 种 最 简单 的 数据 结构 : 栈 。 
7.2.1 编写 不 用 锁 的 线程 安全 栈 

栈 的 基本 假设 是 相当 简单 的 ， 按 照 添 加 结 点 的 逆序 来 检索 结 点 一 一 后 进 先 出 
(LIFO〉。 因 此 ， 确 保 一 次 只 添加 一 个 值 到 栈 中 是 很 重要 的 。 男 一 个 线程 可 以 六 
刻 检 索 结 点 ， 并 且 确 保 只 有 一 个 线程 返回 给 定 的 数值 是 很 重要 的 。 最 简单 的 栈 是 
一 个 链表 ，head 指 针 指 向 第 一 个 结 点 (这 个 结 点 将 被 第 一 个 检索 ) ， 并 且 每 个 结 
点 都 按 顺 序 指 癌 下 一 个 结 点 。 

在 这 种 原则 下 ， 添 加 一 个 节点 相对 比较 简单 。 

1 创建 一 个 新 结 点 。 

2 将 它 的 next 指 针 指向 当前 的 head 结 点。 

3 将 head 结 点 指 疝 此 新 结 皮 。 

在 单线 程 环境 中 ， 这 种 方法 是 可 以 的 。 但 是 如 果 别 的 线程 也 在 修改 栈 ， 那 么 
这 种 方法 就 不 行 了 。 最 重要 的 是 ， 如 果 两 个 线程 同时 添加 结 点 ， 那 么 在 第 2 步 和 


第 3 步 间 就 会 存在 竞争 条 件 。 当 你 的 线程 在 第 2 步 读 取 头 结 点 和 第 3 步 更 新 头绪 点 
之 间 ， 第 二 个 线程 可 能 会 修改 head 的 值 。 这 就 会 导致 另 一 个 线程 所 做 的 修改 无 效 


或 者 有 更 坏 的 影响 。 在 我 们 考虑 解决 这 一 竞争 条 件 之 前 ， 请 注意 一 旦 head 被 更 新 
指 癌 你 新 创建 的 结 点 ， 别 的 线程 就 可 以 读 取 该 结 点 。 因 此 ， 在 head 指 向 新 结 点 之 
前 将 新 结 点 完全 准备 好 也 是 至 关 重 要 的 ， 以 后 就 无 法 修改 此 结 点 了 。 


那么 ， 我 们 能 够 如 何 处 理 此 竞争 条 件 呢 ? 答案 就 是 在 第 3 步 中 使 用 一 个 原子 

比较 /交换 操作 来 保证 从 你 在 第 2 步 中 读 取 它 开始 ，head 就 未 被 修改 过 。 如 果 head 

。 那么 可 以 循环 和 再 次 尝试 。 清 单 7.2 给 出 了 如 何 实现 不 使 用 锁 的 线程 安 
push(). 


清单 7.2 实现 不 使 用 锁 的 线程 安全 push() 


template<typename 工 > 
class lock free stack 
{ 
private: 
struct node 
{ 
T data; 
node* next; 


node (T const& data_): 0 
data(data_) 
{} 
bs 


std::atomic<node*> head; 
public: 
void push(T const& data) 


node* const new node-new node (data); O 2 


new node-»next-head.load(); 
while(!head.compare exchange weak (new node-»next,new node)); <0 


} 


这 段 代 码 恰好 符合 了 上 面 提 到 的 三 点 计划 : 创建 一 个 新 节点 介 ， 将 新 结 点 的 
next 指 针 指向 当前 的 head 合 ， 将 head 指 向 这 个 新 结 点 四 .通过 在 node 构 造 函 数 
@ 中 填充 node 结 构 体 的 数据 ， 这 就 可 以 保证 node 一 被 构造 好 就 可 以 被 使 用 ， 因 此 
这 个 简单 的 问题 就 被 解决 了 。 然 后 使 用 compare_exchange_weak( ) 来 确保 head 
站 针 的 值 与 New_node->next 人 @ 的 值 是 一 样 的 。 如 果 这 两 个 值 是 一 样 的 ， 那 么 
将 head 指 问 new_node。 这 上段 代码 中 使 用 了 比较 /交换 函数 的 一 部 分 ， 如 果 它 返回 
false 则 表明 此 次 比较 没有 成 功 〈 例 如 ， 因 为 另 一 个 线程 修改 了 head) 。 此 时 ， 
第 一 个 参数 Cnew_node- >next) 的 值 将 被 更 新 为 head 当 前 的 值 。 因 此 ， 通 过 此 
次 循环 ， 就 不 需要 你 每 次 重 载 head， 因 为 编译 器 已 经 做 了 此 项 操作 。 同 样 ， 因 为 
失败 时 只 需要 直接 循环 ， 因 此 可 以 使 用 compare_exchange_weak。 在 某 些 架构 
下 ， 它 比 compare_exchange_strong 能 够 产生 更 优化 的 代码 〈 如 第 5 章 所 示 ) 。 


因此 ， 在 没有 pop() 操 作 的 情况 下 ， 先 按照 准则 来 快速 检查 一 下 push()。 唯 
一 能 引发 异常 的 地 方 就 是 构造 新 结 点 的 时 候 @。 但 是 它 之 后 会 清除 这 些 ， 并 且 和 链 
表 没 有 被 修改 ， 因 此 这 是 非常 安全 的 。 因 为 你 建造 的 数据 将 被 存储 为 node 的 一 部 
分 ， 并 且 可 以 使 用 compare_exchange_weak() 来 更 新 head 指 针 ， 因 此 这 里 没有 
成 问题 的 竞争 条 件 。 一 旦 比较 /交换 函数 成 功 了 ， 结 点 就 被 插入 链表 并 可 以 被 使 用 
了 。 这 里 没有 使 用 锁 ， 因 此 不 会 产生 死 锁 ， 并 且 push() 函 数 出 色 地 实现 了 功能 。 


当然 ， 现 在 已 经 有 了 在 栈 中 增加 数据 的 方法 ， 还 需要 在 栈 中 移出 数据 的 方 
法 。 从 表面 上 看 ， 这 要 简单 一 些 。 


1 读 取 head 当 前 的 值 。 


2 读 取 head->next。 


3 将 head->next 设 置 为 head。 
4 返回 检索 到 的 结 点 的 值 。 
5 删除 检索 到 的 结 点 。 


然而 ， 在 存在 多 个 线程 的 情况 下 ， 这 个 问题 就 不 这 么 简单 了 。 如 果 同 时 有 两 
个 线程 从 栈 中 移出 元 素 ， 他 们 可 能 在 第 1 步 中 同时 读 取 了 相同 的 head 值 。 如 果 一 
个 线程 在 其 他 线程 执行 第 2 步 前 顺利 执行 到 第 5 步 ， 那 么 第 二 个 线程 将 被 解 引用 其 
挂 指针 。 这 是 写 无 锁 代 码 中 最 大 的 问题 之 一 。 因 此 从 现在 开始 ， 先 忽略 第 5 步 并 
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但 是 ， 这 也 没有 解决 掉 所 有 的 问题 。 这 里 存在 着 另 一 个 问题 ， 如 果 两 个 线程 
读 取 同 一 个 head 值 ， 那 么 它们 将 会 返回 同一 个 结 点 。 这 就 违背 了 栈 数 据 结构 的 目 
的 ， 因 此 必须 避免 发 生 这 种 情况 。 你 可 以 用 push( ) 中 使 用 的 方法 来 解决 竞争 ， 使 
用 比较 /交换 来 更 新 head。 如 果 比 较 /交换 失败 了 ， 要 么 是 因为 在 栈 中 插入 了 一 个 
新 结 点 ， 要 么 是 因为 刃 一 个 线程 从 栈 中 移出 了 你 打算 移出 的 结 点 。 无 论 是 哪 一 种 
情况 ， 都 需要 返回 到 第 1 步 〈《 尽 管 比较 /交换 调用 可 以 重新 读 取 head) 。 


一 旦 比较 /交换 调用 成 功 了 ， 那 么 这 就 是 唯一 的 从 栈 中 移出 指定 结 点 的 线程 。 
因此 可 以 安全 地 执行 第 4 步 。pop() 如 下 所 示 。 


template<typename 工 > 
class lock free stack 


{ 
public: 
void pop(T& result) 


{ 


node* old head-head.load(); 
while(!head.compare exchange weakí(old head,old head-»next)); 
result-old head-»data; 


尽管 这 种 方法 很 好 很 简明 ， 但 是 除了 未 删除 的 结 点 外 还 有 一 些 别 的 问题 。 首 
先 ， 当 链表 为 空 时 它 就 行 不 通 了 ， 如 果 head 是 空 指针 ， 那 么 当 它 试图 读 取 next 指 
针 时 就 会 导致 未 定义 的 行为 。 这 也 很 容易 通过 在 while 循 环 中 检查 空 指针 来 解 
决 。 可 以 同时 在 空 栈 上 引发 异常 或 者 返回 一 个 boo1l 来 表明 成 功 或 失败 。 

第 二 个 问题 就 是 异常 安全 问题 。 当 我 们 在 第 3 章 中 首次 介绍 线程 安全 栈 时 ， 

你 可 以 看 出 只 通过 值 返回 对 象 会 留 下 一 个 异常 安全 问题 ， 当 复制 返回 值 的 时 候 ， 
如 果 引 发 了 异常 ， 那 么 此 值 就 会 被 丢失 。 在 这 种 情况 下 ， 传 递 对 值 的 引用 是 一 种 
解决 方法 。 因 为 如 果 抛 出 异常 的 话 ， 这 可 以 确保 栈 不 会 被 修改 。 可 惜 ， 这 里 不 能 
使 用 这 种 方法 。 一 旦 你 知道 这 是 唯一 一 个 返回 结 点 的 线程 ， 你 就 可 以 安全 地 复制 
数据 了 。 这 就 意味 着 这 个 结 点 已 经 被 移出 队列 了 。 因 此 ， 通 过 引用 传递 返回 值 的 
对 象 就 不 再 是 一 个 优势 了 ， 当 然 也 可 能 只 是 返回 值 。 如 果 想 安全 地 返回 值 ， 就 必 
须 使 用 第 3 章 中 提 到 的 男 一 个 方法 ， 返 回 一 个 指向 数据 值 的 (智能 ) 指针 。 


如 果 返 回 智能 指针 ， 那 么 就 可 以 只 返回 空 指针 来 表明 没有 返回 值 ， 但 是 这 就 
要 求 数据 是 在 堆 上 被 分 配 的 。 如 果 将 堆 分 配 作 为 pop() 的 一 部 分 ， 你 仍然 没有 做 
得 更 好 ， 因 为 堆 分 配 也 可 能 会 引发 异常 。 反 而 ， 当 把 数据 push() 进 栈 时 ， 可 以 为 
此 数据 分 配 内 存 一 一 反正 都 要 为 结 点 分 配 内 存 。 返 回 std: :shared_ptr<> 不 会 引 
发 异常 ， 因 此 pop() 是 安全 的 。 将 这 些 总 结 起 来 得 到 清单 7.3 所 示 的 代码 。 


清单 7.3 ”缺少 结 点 的 无 锁 栈 


template<typename T> 
class lock_free_stack 


{ 


private: 
struct node : 
{ Q soe 现在 由 指针 持 有 
std: :shared ptr<T> data; a 


node* next; 


node (T const& data ): 
data (std: :make_shared<T> 


{} 


9 为 新 分 配 的 工 创 建 
(data_)) 4 std::shared ptr 


std::atomic«node*» head; 


public: 
void push(T const& data) 


node* const new node-new node (data); 
new node-»next-head.load(); 
while(!head.compare exchange weak (new node-»next,new node)); 


E :shared ptr«T» pop() © 在 解 引 用 之 前 检查 old head 不 是 
node* old head-head.load(); 一 个 空 指针 
while(old head && < 一 
!head.compare exchange weak (old head,old head-»next)); 
return old head ? old head-»data : std::shared_ptr<T>(); 0 


数据 现在 由 指针 持 有 @， 因 此 需要 在 结 点 构造 函数 中 在 堆 上 分 配 数 据 人 @。 
在 compare_exchange_weak() 循 环 中 解 引用 ol1d_head 前 ， 必 须 检查 空 指 针 。 最 
后 ， 如 果 存 在 与 结 点 相关 的 值 ， 那 么 就 返回 该 值 ， 否 则 就 返回 一 个 空 指针 。 注 
意 ， 尽 管 这 是 无 锁 的 ， 但 是 它 不 是 无 等 待 的 ， 因 为 在 push() 和 pop() 的 while 循 
环 中 ， 如 果 compare_exchange_weak() 一 直 失 败 的 话 ， 理 论 上 可 以 一 直 循 环 下 
X. 


如 果 有 垃圾 回收 器 在 你 后 面 打 点 《比如 在 C# 或 Java 这 样 的 托管 语言 中 ) ， 那 
么 此 工作 就 已 完成 了 。 一 旦 没有 线程 存 取 此 结 点 ， 那 么 旧 的 结 点 被 收集 并 被 再 次 
利用 。 然 而 ， 没 有 多 少 C++ 编译 器 有 垃圾 回收 右 ， 因 此 通常 需要 上 自己 整理 。 


7.2.2 ”停止 恼人 的 泄漏 : 在 无 锁 数 据 结构 中 管理 内 存 


我 们 首先 观察 pop()， 当 一 个 线程 删除 结 点 ， 而 男 一 个 线程 仍然 持 有 指向 此 
结 点 的 指针 时 ， 我 们 选择 泄漏 结 点 来 避免 竞争 条 件 ， 那 么 就 只 能 解 引用 了 。 尽 管 
如 此 ， 在 任何 合理 的 C++ 程序 中 ， 洪 漏 内 存 都 是 不 可 接受 的 。 因 此 ， 我 们 必须 做 
一 些 事 。 现 在 该 考虑 这 个 问题 并 且 找 出 解决 办 法 了 。 


最 基本 的 问题 就 是 ， 你 想 释 放 一 个 结 点 ， 但 是 直到 你 确保 没有 别 的 线程 持 有 
指向 此 结 点 的 指针 的 时 候 ， 你 才能 释放 此 结 点 。 如 果 只 有 一 个 线程 曾经 在 一 个 特 
定 的 栈 实例 上 调用 pop()， 那 么 可 以 自由 释放 此 结 点 。 一 旦 结 点 被 添加 到 栈 


中 ，push( ) 就 不 会 再 操作 此 结 点 了 。 因 此 调用 pop() 的 线程 就 一 定 是 唯一 一 个 操 
作 此 结 点 的 线程 ， 并 且 可 以 安全 地 删除 此 结 点 。 


男 一 方面 ， 如 果 需 要 处 理 多 个 线程 在 同一 个 栈 实例 上 调用 pop() 的 情况 ， 那 
么 就 需要 一 些 方法 来 追踪 何 时 可 以 安全 地 删除 结 点 。 这 就 从 根本 上 意味 着 你 需要 
为 结 点 写 一 个 专用 的 垃圾 回收 器 。 现 在 ， 这 可 能 听 上 去 很 可 介 ， 尽 管 它 确 实 很 讨 
厌 ， 但 是 也 不 是 太 糟 糕 。 只 需要 检查 结 点 ， 并 且 只 检查 在 pop() 中 存 取 的 结 点 。 
不 需要 担心 在 push() 中 存 取 的 结 点 ， 因 为 它们 只 能 被 一 个 线程 存 取 ， 直 到 它们 在 
栈 上 为 止 。 然 而 ， 多 个 线程 可 能 在 pop() 中 存 取 同一 个 结 反 。 


如 果 没 有 线程 调用 pop()， 那 么 可 以 删除 目前 等 等 删除 的 所 有 结 点 。 因 此 ， 
当 你 获得 数据 时 ， 如 果 将 此 结 点 添加 到 “将 被 删除 * 的 列表 中 ， 那 么 当 没 有 线程 调 
用 pop() 时 就 可 以 删除 它 。 如 何 知道 有 没有 别 的 线程 在 调用 pop() 呢 ?7 有 个 简单 
的 方法 一 一 数 清 数目 。 如 果 在 进入 的 时 候 计 数 器 加 一 ， 在 离开 的 时 候 计 数 髓 减 
一 。 那 么 当 计 数 咒 为 零 的 时 候 ， 就 可 以 安全 地 删除 "将 被 删除 ?列表 中 的 结 点 。 当 
然 ， 此 计数 器 必须 为 原子 计数 姻 ， 从 而 可 以 安全 地 被 多 个 线程 存 取 。 清 单 7.4 给 出 
了 修改 后 的 pop( ) 函 数 ， 并 且 清 单 7.5 列 出 了 此 实现 的 支撑 函数 。 


清单 7.4” 当 pop0 中 没有 线程 时 回收 结 点 


template<typename T> 

class lock free stack 

{ 

private: Q 77:5 
std::atomic«unsigned» threads in pop; <- 
void try_reclaim(node* old_head) ; 

public: 
std::shared ptr<T> pop() 


在 做 任何 其 他 事情 前 增 
{ 
++threads_in_pop; 434 加 计数 
node* old headzhead.load(); 
while(old head && 
!head.compare exchange weak(old head,old head-»next)); 
std::shared ptr<T> res; 
if(old head) "iis n ^ 
- © 如 果 可 能 ， 回 收 删除 的 
{ 结 点 
res.swapí(old head-»data); a 7H 
try reclaim(old head); 


return res; 6 从 结 点 中 提取 数据 ， 而 不 是 
} 复制 指针 


原子 变量 threads_in_pop@ 被 用 作 计 数目 前 有 多 少 线程 试图 从 栈 中 移出 数 
据 项 。 在 pop() 开 始 的 地 方 @ 增 加 计数 器 ， 在 try_reclaim( ) 中 减少 计数 器 ， 而 
一 旦 结 点 被 移出 的 时 候 就 会 调用 此 函数 全 。 因 为 可 能 将 延迟 删除 结 点 ， 因 此 可 以 
使 用 swap( ) 来 将 数据 从 结 点 中 删除 人 @， 而 不 是 仅仅 复制 指针 。 因 此 当 不 再 需要 时 


可 以 自动 地 删除 此 数据 ， 而 不 会 因为 存在 对 未 删除 结 点 的 引用 而 一 直 保持 它 。 清 
单 7.5 给 出 了 try_reclaim() 的 内 部 实现 。 


清单 7.5 引用 计数 的 回收 机 制 


template<typename T> 
class lock free stack 


{ 


private: 
std::atomic«node*» to be deleted; 


static void delete nodes (node* nodes) 


( 
while (nodes) 
{ 
node* next=nodes->next; 
delete nodes; 
nodes-next; 
} 
} 列 出 将 要 被 删除 的 结 点 
void try reclaim(node* old head) 清单 
if (threads_in_pop==1) 0 


{ 


node* nodes to delete-to be deleted.exchange (nullptr) ; 

if(!--threads in pop) 

{ “时 是 pop0 中 唯 ha 
delete nodes(nodes to delete); —0 


else if(nodes to delete) 0 


{ 


chain pending nodes (nodes to delete); <t © 

E old head; 2:9 

} 

else 

{ 
chain pending node(old head); -© 
--threads_in_pop; 

} 

} 


void chain pending nodes (node* nodes) 


跟随 下 一 个 指针 ， 链 至 
node* last=nodes; x! 
while(node* const next=last->next) < 一 尾 
{ 
last=next; 


} 
chain pending nodes (nodes, last) ; 
} 
void chain pending nodes (node* first,node* last) 


{ 


last-»next-to be deleted; <4 
whilel(!to be deleted.compare exchange weak! a, 
last-»next,first)); 
} 箱 环 以 保证 last-^next 
void chain pending node (node* n) © 正确 
{ 
chain pending nodes (n,n); -+ 


} 


当 回 收 结 点 时 ， 如 果 threads_in_pop 的 值 为 1@， 那 么 在 pop( ) 中 这 就 是 唯 
一 的 线程 ， 这 就 意味 着 可 以 安全 删除 刚 移动 出 来 的 结 点 @， 并 且 可 能 安全 地 删除 
等 待 的 结 点 。 如 果 计 数 器 的 值 不 为 1， 那 么 删除 任何 结 点 都 不 安全 ， 因 此 将 此 结 
点 加 入 到 等 待 的 列表 中 合 。 


现在 假设 threads_in_pop 的 值 为 1。 此 时 需要 回收 等 待 的 结 点 ;如 果 不 回 
收 ， 那 么 这 些 结 点 将 一 直 等 待 直到 栈 被 销毁 。 回 收 结 点 时 ， 首 先 用 原子 操 
作 exchange 来 查找 列表 @， 然 后 将 threads_in_pop 的 计数 减 一 上 四。 如 果 计 数 减 
一 后 值 为 零 ， 就 可 以 得 知 没 有 别 的 线程 存 取 此 等 待 结 点 列表 。 可 能 会 有 新 的 等 待 
结 点 ， 但 是 只 要 回收 列表 是 安全 的 ， 就 不 需要 操心 这 些 新 的 等 待 结 点 。 然 后 ， 调 
用 delete_nodes 来 迭代 此 列表 ， 并 且 删 除 结 点 @。 


如 果 计 数 减 一 后 值 不 为 零 ， 那 么 回收 结 点 就 不 安全 了 。 因 此 如 果 此 时 有 等 待 
的 结 点 @， 那 么 就 将 此 结 点 插入 到 等 待 删除 结 点 列表 的 尾部 @@。 当 多 个 线程 同时 
存 取 数据 结构 时 就 有 可 能 发 生 这 种 情况 。 别 的 线程 可 能 在 第 一 次 取 
threads_in_pop 值 @ 和 查找 列表 @ 之 间 调 用 pop()。 这 就 可 能 在 列表 中 增加 新 的 
结 点 ， 并 且 此 结 点 被 一 个 或 多 个 线程 存 取 。 在 图 7.1 中 ， 线 程 C 增 加 结 点 Y 至 
to_be_deleted 列 表 中 ， 即 使 线程 B 仍 然 引 用 结 点 Y 作 为 o1d_head， 并 且 会 读 取 
此 结 点 的 next 指 针 。 因 此 线程 A 在 删除 结 点 的 时 候 不 可 避免 地 会 造成 线程 B 未 定 


义 的 行为 。 


初始 
to be deleted—>| A|—> 


threads in pop == 


线程 A 调用 pop () 并 且 在 首次 读 取 threads_in_pop 
之 后 被 try_reclaim() 抢 占 


to be deleted» a ]— 


threads in pop -- 1 (线程 A) 
线程 B 调 用 pcp() 并 且 在 首次 读 取 heaa 之 后 被 抢占 
old_head 


to_be deleted 


threads in pop == 2 (线程 A 和 了 B) 


线程 C 调 用 pep() 并 且 一 直 运 行 到 Pop() 返 回 


to_be deleted 


threads in pop == 2 (线程 A 和 B、C 已 完成 ) 


线程 A 恢复 并 且 仅 在 执行 了 


to be deleted.exchange (nullptr) 之 后 才 被 抢 i 


head —— dz} 
nodes to delete 


如 果 我 们 不 再 次 测试 threads_in_pop 结 点 Y 和 A 会 被 删除 
threads in pop == 


to be deleted— —» nullptr 


线程 B 恢 复 并 且 为 调用 compare_exchange_strong () 
而 读 取 old_head->next 


head’ 


old_head X 


l X 结 点 Y 在 A 的 
threads in pop == 2 to be deleted WHE 


图 7.1 三 个 线程 并 发 调用 pop0， 在 回收 try_reclaim0 中 删除 的 结 点 之 后 必须 检查 threads_in_pop。 


为 了 将 等 竺 删除 的 结 点 链接 到 等 待 列表 中 ， 需 要 重新 使 用 结 点 的 next 指 针 来 
将 它们 链接 起 来 。 对 于 重新 链接 一 个 已 存在 链表 到 列表 尾部 ， 则 需要 遍历 链表 来 
找到 尾部 人 @， 用 当前 的 to_be_deleted 指 针 来 蔡 代 最 后 一 个 结 点 的 next 指 针 人 @O， 
并 且 存 储 链表 中 的 第 一 个 结 点 作为 新 的 to_be_deleted 指 针 @。 必 须 在 循环 中 使 
用 compare_exchange_weak 来 确保 没有 遗漏 其 他 线程 添加 的 结 点 。 这 种 做 法 的 
好 处 是 当 链 表 发 生变 化 时 ， 从 链 尾 更 新 next 指 针 。 在 链表 中 添加 一 个 结 点 是 一 种 
特殊 情况 ， 即 链表 中 添加 的 第 一 个 结 点 与 最 后 一 个 结 点 是 相同 的 @。 


在 低 负载 的 情况 下 ， 即 当 没 有 进程 在 调用 pop() 这 样 一 种 合适 的 静态 点 的 时 
候 ， 这 种 方法 是 很 有 效 的 。 尽 管 如 此 ， 在 回收 结 点 和 删除 刚 移 出 的 结 点 之 前 @@ 都 
需要 检查 threads_in_pop 计 数 器 是 否 减少 为 零 人 全， 这 是 因为 这 种 状态 是 很 短暂 
的 。 删 除 结 点 是 一 种 会 消耗 一 定时 间 的 操作 ， 并 且 别 的 线程 修改 列表 的 窗口 越 小 
越 好 。 在 线程 第 一 次 发 现 threads_in_pop 的 值 为 1 与 试图 删除 结 点 之 间 的 时 间 越 
长 ， 别 的 线程 调用 pop() 以 及 threads_in_pop 的 值 不 再 为 1 的 可 能 性 就 越 大 ， 
此 就 阻止 了 些 结 点 被 真正 的 删除 。 


在 高 负载 的 情况 下 ， 因 为 在 其 他 线程 调用 pop() 结 束 之 前 就 会 有 别 的 线程 调 
用 pop()， 因 此 基本 上 不 可 能 有 这 种 静止 状态 。 在 这 种 情况 下 ，to_be_deleted 
列表 很 容易 就 越界 了 ， 并 且 再 次 内 存 泄露 。 如 果 没 有 任何 静止 状态 ， 那 么 就 需要 
用 别 的 方法 来 回收 结 点 。 关 键 点 就 是 识别 没有 别 的 线程 将 访问 某 个 特定 的 结 点 ， 
那么 就 可 以 回收 此 结 点 了 。 迄 今 为 止 ， 最 简单 的 方法 就 是 使 用 风险 指针 


(hazardpointers) . 


7.2.3 ”用 风险 指针 检测 不 能 被 回收 的 结 点 


术语 风险 指针 (hazardpointers〉 是 Maged Michaeli 提 出 的 一 种 技术 。 基 本 
思想 就 是 如 果 一 个 线程 准备 访问 别 的 线程 准备 删除 的 对 象 ， 那 么 它 会 用 风险 指针 
来 引用 对 象 ， 因 此 就 可 以 通知 别 的 线程 删除 此 对 象 可 能 是 有 风险 的 。 如 果 别 的 线 
程 引用 此 结 点 ， 并 且 准 备 通过 此 引用 来 访问 结 点 ， 那 么 删除 一 个 可 能 仍然 被 别 的 
线程 引用 的 结 点 是 有 人 危险 的 ， 因 此 它们 被 称 为 风险 指针 。 一 旦 不 再 需要 此 对 象 ， 
风险 指针 就 会 被 清除 了 。 如 果 你 看 过 牛津 /剑桥 划船 比赛 ， 就 可 以 发 现 当 比赛 开始 
时 使 用 了 一 个 相似 的 方法 : 每 租 船 的 舵手 都 可 以 举 手 示意 他 们 没有 准备 好 。 当 任 
何 一 个 舵手 举 手 的 时 候 ， 裁 判 都 不 能 开始 比赛 。 如 果 舵 手 都 没有 举 手 ， 那 么 就 可 
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会 发 生 改 变 。 


当 线 程 试 图 删除 一 个 对 象 时 ， 它 必须 首先 检查 别 的 线程 所 持 有 的 风险 指针 。 
如 果 没 有 风险 指针 引用 此 对 象 ， 那 么 就 可 以 删除 此 对 象 。 否 则 ， 它 必须 之 后 才能 
被 处 理 。 周 期 性 地 检查 对 象 列表 来 确定 现在 是 否 可 以 删除 它 。 


用 这 种 方式 描述 的 时 候 是 比较 简单 明了 的 ， 那 么 在 C++ 中 如 何 实现 呢 ? 


首先 ， 需 要 一 块 共享 内 存 来 存储 正在 访问 对 象 的 指针 ， 即 风险 指针 本 有 身 。 此 
地 址 必须 对 所 有 线程 可 见 ， 并 且 每 个 访问 此 数据 结构 的 线程 都 需要 其 中 一 段 内 
存 。 如 何 正 确 并 且 有 效 地 分 配 它 们 ， 我 们 会 在 后 面 章 节 介 绍 。 先 假设 已 经 有 这 样 
一 个 函数 get_hazard pointer for current thread()， 它 返回 风险 指针 的 引 
用 。 当 线程 试图 解 引 用 正在 读 取 的 指针 的 时 候 ， 需 要 设置 它 的 风险 指针 。 在 这 里 
我 们 以 解 引 用 列表 的 head 值 为 例 。 


std::shared ptr«T» pop() 


{ 
std: :atomic<void*>& hp-get hazard pointer for current thread(); 
node* old head-head.load(); 
node* temp; Ò 
do 
{ 
temp=old_ head; 
hp.store(old head); + 人 © 
old head-head.load(); 
} while (old_head!=temp) ; e 
£T 3 #3 
} 


在 while 循 环 中 ， 确 保 在 读 取 旧 的 head 指 针 @ 和 设置 风险 指针 @ 之 间 ， 结 点 
未 被 删除 。 在 此 窗口 内 ， 别 的 线程 不 知道 你 正在 读 取 这 个 特定 的 结 点 。 坟 运 的 
是 ， 如 果 旧 的 头 指 针 将 被 删除 ， 那 么 头 结 点 肯定 会 发 生 改 变 ， 因 此 必须 持续 循环 
直到 确定 头 指 针 与 之 前 设置 的 风险 指针 相同 仿 。 使 用 风险 指针 取决 于 当 它 引用 的 
对 象 被 删除 后 ， 仍 然 可 以 安全 地 使 用 此 指针 。 如 果 使 用 缺 省 的 new 和 delete 实 
现 ， 那 么 就 会 导致 未 定义 的 行为 。 因 此 ， 需 要 确保 你 的 实现 可 以 保证 这 一 点 ， 或 
者 使 用 允许 这 种 行为 的 自 定义 分 配器 。 


现在 ， 我 们 已 设置 好 风险 指针 ， 就 可 以 完成 pop( ) 中 剩余 的 代码 。 此 时 没有 
线程 将 会 删除 你 所 占用 的 结 点 了 。 那 么 每 次 重 载 ol1d_head， 都 需要 在 解 引用 新 读 
取 的 指针 前 更 新 风险 指针 。 一 旦 从 列表 中 获得 了 结 点 ， 束 可 以 清除 风险 指针 。 如 
果 此 时 没有 别 的 风险 指针 引用 此 结 点 ， 就 可 以 安全 删除 此 结 点 。 否 则 ， 就 将 此 结 
点 加 入 等 待 稍 后 删除 的 结 点 列表 。 清 单 7.6 演 示 了 使 用 此 策略 的 pop() 的 完整 实 
现 。 


清单 7.6 ”使 用 风险 指针 的 pop0 实 现 


std: :shared ptr<T> pop() 

{ 
std: :atomic<void*>& hp=get hazard pointer for current thread(); 
node* old head-head.load(); 


一 直 循环 到 你 将 风险 指 
de* np; “i 
^ ncm aT 针 设置 到 head 上 
{ 


temp=old_head; 

hp.store(old head); 

old head-head.load(); 

] while(old head!-temp); 
) 
while(old head && 
!head.compare exchange strong(old head,old head-»next)); 

hp.store (nullptr) ; < 
std::shared ptr«T» res; 当 你 完成 时 清除 风险 


if (old_head) 指针 @ 在 你 删除 一 个 结 点 前 
{ 检查 风险 指针 是 否 引 
res.swap(old head- >data); AT 
if (outstanding hazard pointers for(old head)) «~ 
{ 
reclaim later(old head); <4 o 
} 
else 
{ 
delete old_head; +0 
} 
delete nodes with no hazards (); 0O 


1 


了 
return res; 


首先 ， 将 设置 风险 指针 放 到 外 部 循环 中 ， 如 果 比 较 / 交 换 失 败 ， 则 重 

old head@. 这 里 使 用 compare_exchange_strong() 是 因为 在 这 个 while 循 
环 中 确实 有 效 ，compare_exchange_weak() 中 虚假 的 错误 会 导致 不 必要 地 重 置 

风险 指针 。 这 就 确保 了 在 解 引用 old_head 前 设置 了 正确 的 风险 指针 。 一 旦 声明 此 
结 点 是 你 的 ， 就 可 以 清除 你 的 风险 指针 人 @。 如 果 你 得 到 一 个 结 点 ， 束 需要 检查 别 
的 线程 拥有 的 风险 指针 是 否 引 用 它 合 。 如 果 存 在 这 样 的 风险 指针 ， 那 么 必须 将 它 
放 入 到 稍 后 回收 的 列表 中 人 @。 否 则 ， 就 可 以 立刻 删除 它 人 @。 最 后 ， 调 

用 reclaim_late( ) 来 检查 所 有 结 点 。 如 果 没 有 别 的 风险 指针 引用 这 些 结 点 ， 那 

么 可 以 安全 删除 它们 @。 任 何 有 风险 指针 的 结 点 都 将 留待 下 一 个 线程 调用 pop()。 


当然 ， 在 这 里 有 很 多 新 函数 

get hazard pointer for current thread(). reclaim later()、out 
以 及 delete_nodes_with_no_hazards() 中 有 很 多 细节 部 分 一 一 让 我 们 来 了 解 
这 些 函 数 并 且 看 看 它们 是 如 何 工作 的 。 


调用 get_hazard_pointer_ for current thread() 给 线程 分 配 风 险 指 针 的 
有 具体 机 制 并 不 影响 程序 的 逻辑 〈 稍 后 就 可 以 看 到 对 效率 有 影响 )》 。 因 此 我 们 先 用 
一 个 简单 的 结构 来 实现 ， 一 个 固定 大 小 数组 存放 线程 ID 和 指针 
Xj. get hazard pointer for_current_thread() 检 索 整 个 数组 来 寻找 第 一 个 
空闲 的 位 置 ， 并 且 将 此 位 置 的 ID 值 设 为 当前 线程 的 ID。 当 线程 退出 时 ， 此 位 置 的 
ID 值 被 重 置 为 默认 值 std: :thread: :id()， 从 而 此 位 置 就 被 释放 出 来 了 ， 如 清单 


7.7 所 示 。 


清单 7.7 ”get_hazard_pointer_for_current_thread0 的 简单 实现 


unsigned const max hazard pointers=100; 
struct hazard pointer 


( 


std: :atomic<std::thread::id> id; 
std: :atomic<void*> pointer; 
}; 


hazard pointer hazard pointers[max hazard pointers]; 


class hp owner 


( 


hazard pointer* hp; 


public: 
hp owner(hp owner const&)-delete; 
hp owner operator-(hp owner const&)-delete; 


hp owner(): 
hp (nullptr) 
{ 


for {unsigned i=0;i<max_hazard_pointers; ++i) 


{ 


std: :thread::id old id; 

if(hazard pointers[il.id.compare exchange strong( 
old id,std::this thread::get id())) 

{ 


hp=&hazard_pointers [i]; 试 着 获取 风险 指针 的 所 


A break; aR 


} 
if (!hp) 0 
{ 
throw std::runtime error("No hazard pointers available"); 


) 


std: :atomic<void*>& get pointer() 


{ 


} 
~hp_owner () EX 2] 
{ 


hp-»pointer.store (nullptr); 
hp->id. store (std: :thread::id()); 


return hp->pointer; 


B 


std: :atomic<void*>& get hazard pointer for current thread() 2a 
{ 

thread local static hp owner hazard; 7" 3 

return hazard.get pointer(); ag 每 个 线程 有 自己 的 风险 
} 指针 


get hazard pointer for _current_thread() 的 实现 看 似 简 单 ， 其 实 不然 
©: 它 用 hp_owner@ 类 型 的 thread_1local 变 量 来 存储 当前 线程 的 风险 指针 。 然 


后 它 返 回 此 对 象 的 指针 全 。 它 的 原理 如 下 : 每 个 线程 第 一 次 调用 此 函数 的 时 候 ， 
创建 一 个 新 的 hp_owner 实 例 。 这 个 新 实例 构造 器 搜索 所 有 者 /指针 对 的 表格 来 寻 
找 一 个 值 ， 此 值 没 有 所 有 者 。 它 使 用 compare_exchange_strong() 来 检查 没有 
BUG AVS BRE EO. ül&compare exchange strong() AW f. MAR 
说 明 另 一 个 线程 拥有 此 值 ， 那 么 就 需要 去 检查 下 一 个 值 。 如 果 
compare_exchange_strong() 成 功 了 ， 那 么 当前 线程 就 成 功 获得 此 值 。 此 时 就 
存储 此 值 ， 并 且 停 止 检索 人 @。 如 果 在 整个 列表 中 痢 没 有 找到 一 个 空 亲 的 值 @@， 那 
么 就 表示 有 太 多 线程 使 用 了 风险 指针 ， 此 时 就 抛 出 异常 。 


旦 为 一 个 给 定 的 线程 创造 了 hp_owner 实 例 ， 那 么 之 后 的 存 取 就 变 得 更 快 
了 ， 因 为 缓存 了 指针 ， 就 不 需要 再 次 扫描 表格 了 。 
当 每 个 线程 退出 时 ， 为 该 线程 创造 的 hp_owner 实 例 就 被 销毁 了 。 析 构 函 数 在 
设置 所 有 者 的 ID 的 值 为 std: :thread: :id() 前 将 指针 的 值 重 置 为 nullptr， 这 样 
稍 后 别 的 线程 就 可 以 重新 使 用 此 值 回 。 


用 这 种 方式 实现 get_hazard_pointer_for_current_thread()， 那 
么 outstanding_hazard_pointer_for_current_thread() 的 实现 就 变 得 简单 
了 ， 只 需要 检索 整个 风险 指针 表 来 寻找 这 个 位 置 。 


bool outstanding hazard pointers for(void* p) 


i for (unsigned i=0;i<max_hazard_pointers;++i) 
{ 
if (hazard pointers [i] .pointer.load(})==p) 
return true; 
} 
} 


return false; 


现在 甚至 都 不 需要 检索 表 来 得 知 每 个 位 置 是 否 拥有 所 有 者 ， 没 有 所 有 者 的 位 
置 将 会 有 一 个 空 指 针 ， 因 此 这 个 比较 函数 将 返回 false， 这 样 就 简化 了 代码 。 


在 简单 链表 中 ，reclaim later() 和 delete nodes with no_hazards() 
可 以 工作 ，reclaim later() 只 添加 结 点 至 列表 
rH, delete nodes _with_no_hazards() 扫 描 整 个 列表 ， 删 除 没有 风险 的 值 。 
清单 7.8 就 是 一 个 实现 。 


清单 7.8 回收 函数 的 简单 实现 


template<typename 工 > 
void do delete(void* p) 


{ 
} 


struct data to reclaim 


{ 


delete static cast<T*>(p) ; 


void* data; 
stds :function<void (void*)> deleter; 
data to reclaim* next; 


template«typename T» 


data to reclaim(T* p): 0 
data(p), 
deleter(&do delete<T>), 
next (0) 


Ü 


~data to reclaim(í) 


{ 
deleter (data); —. 
} 
}; 


std: :atomic<data_ to reclaim*» nodes to reclaim; 


void add_to_reclaim_list (data to reclaim* node) «e 


{ 


node->next=nodes to reclaim.load(); 

while(!nodes to reclaim.compare exchange weak (node-»next,node)); 
} 
template<typename T> 
void reclaim later(T* data) 0 


{ 
} 


void delete nodes with no hazards() 


{ 


add to reclaim list (new data to reclaimí(data)); «9 


data to reclaim* current-nodes to reclaim.exchange (nullptr); <O 
while (current) 


{ 


data to reclaim* const next-current-»next; 


if(!outstanding hazard pointers for(current->data) } +@ 
{ 
delete current; «9 
) 
else 
{ 
add_to_reclaim_list (current) ; 0 


} 


current=next ; 


首先 ， 我 希望 你 发 现 reclaim_later() 不 是 一 个 普通 的 函数 ， 而 是 一 个 函数 
模板 个。 这 是 因为 风险 指针 是 一 种 通用 的 工具 ， 因 此 不 希望 绑 定 到 具体 的 结 点 。 
你 已 经 使 用 std: :atomic<void> 来 存储 指针 了 。 因 此 需要 处 理 任何 指针 类 型 ， 但 
是 不 能 使 用 void 类 型 。 因 为 当 你 删除 数据 项 的 时 候 ，delete 函 数 需 要 指针 的 实 
际 类 型 。date_to_reclaim 的 构造 器 可 以 很 好 地 处 理 这 个 问题 ， 束 如 以 下 所 
示 。reclaim_later() 只 需要 为 你 的 指针 生成 一 个 新 的 date_to_reclaim 实 
例 ， 并 且 将 它 加 入 到 回收 列表 中 人 @@。add_to_reclaim 1ist() 本 身 @ 是 一 个 基 
于 列表 头 结 点 的 简单 compare_exchange_weak( ) 循 环 。 


因此 ， 回 到 data_to_reclaim 的 构造 函数 @， 这 个 构造 函数 也 是 一 个 模板 。 
它 将 被 删除 数据 存储 为 data 成 员 的 void 类 型 。 然 后 存储 指向 do_delete() 实 例 的 
指针 。do_delete() 是 一 个 简单 的 函数 ， 将 提供 的 void 类 型 确定 为 选 好 的 指针 类 
型 ， 然 后 删除 它 所 指向 的 对 象 。std: :functionx> 可 以 安全 地 实现 这 个 函数 指 
针 ， 因 此 data_to_reclaim 的 析 构 函数 可 以 调用 存储 的 函数 来 删除 数据 人 @。 


当 你 在 列表 中 增加 结 点 时 ， 不 会 调用 data_to_reclaim 的 析 构 器 。 当 没有 风 
险 指针 指向 此 结 点 时 就 会 调用 此 析 构 函数 。 这 


是 delete_nodes_with_no_hazards() 的 责任 。 


delete_nodes_with_no_hazards() 首 先 用 一 个 简单 的 exchange() 来 声明 
所 有 将 被 回收 的 结 点 列表 @。 这 一 简单 但 是 关键 的 步 又 确保 了 这 是 将 回收 这 个 结 
点 集合 的 唯一 线程 。 别 的 线程 可 以 自由 向 列表 中 增加 结 点 或 者 试图 回收 它们 ， 并 
且 不 会 影响 此 线程 的 操作 。 


然后 ， 只 要 列表 中 仍然 有 结 点 ， 就 轮流 检查 每 个 结 点 来 看 是 否 存 在 风险 指针 
O. 如 果 没 有 ， 则 安全 删除 此 位 置 的 值 〈“ 即 清除 了 存储 的 数据 ) O. 否则， 就 将 
此 项 增加 到 稍 后 回收 列表 中 人 。 


尽管 这 种 简单 实现 能 够 安全 回收 删除 的 结 点 ， 但 是 它 会 增加 很 多 处 理 难 度 。 
扫描 风险 指针 数组 需要 检查 max_hazard_pointers 原 子 变量 ， 并 且 每 次 调用 pop( 
) 的 时 候 都 会 执行 这 个 操作 。 原 子 操作 必定 是 很 慢 的 一 一 通常 在 计算 机 CPU 上 运行 
时 会 比 实 现 同样 效果 的 非 原 子 操作 慢 100 倍 一 一 这 就 使 得 pop() 变 成 很 耗资 源 的 操 
作 。 不 仅 需 要 扫 搞 将 要 删除 结 点 的 风险 指针 列表 ， 而 且 需 要 扫 摘 等待 列表 中 每 个 
结 点 的 风险 指针 列表 。 这 当然 不 是 个 好 主意 。 如 果 列 表 中 
有 max_hazard_pointers 个 结 点 ， 那 么 就 得 扫描 这 些 结 点 存储 的 风险 指针 。 天 
啊 ! 必须 找到 一 种 更 好 的 方法 。 


使 用 风险 指针 的 更 佳 的 回收 策略 


当然 ， 有 更 好 的 方法 。 这 里 我 将 介绍 一 种 简单 的 风险 指针 实现 来 解释 这 种 机 
制 。 第 一 件 事 就 是 用 内 存 资 源 换取 效率 。 你 不 再 试图 回收 任何 结 点 除非 表 中 的 结 
点 数 多 于 max_hazard_pointers， 而 不 再 每 次 都 调用 pop() 来 检查 回收 列表 中 每 
个 结 点 。 用 这 种 方式 可 以 保证 至 少 回 收 一 个 结 点 。 如 果 只 是 等 到 表 中 
有 max_hazard_pointers+1 个 结 点 ， 这 种 方法 也 没有 更 好 。 一 旦 你 得 
到 max_hazard_pointers 个 结 点 ， 就 开始 调用 pop() 来 回收 结 点 ， 这 种 方法 也 没 
有 更 好 。 但 是 如 果 你 等 到 表 中 有 2#xmax_hazard_pointers 个 结 点 ， 就 可 以 确保 
收回 至 少 max_hazard_pointers 个 结 点 ， 并 且 在 你 回收 任何 结 点 前 至 少 
会 max_hazard_pointers 次 调用 pop()。 这 种 方法 就 比较 好 了 。 你 
在 max_hazard_pointers 次 调用 pop() 的 时 候 都 会 检查 
2*max_hazard_pointers 个 结 点 ， 并 且 至 少 回收 max_hazard_pointers 个 结 
点 。 而 不 需要 每 次 调用 push() 的 时 候 检 查 max_hazard_pointers 个 结 点 。 这 样 
是 很 有 效 的 ， 每 次 调用 pop() 都 会 检查 两 个 结 点 ， 回 收 一 个 结 点 。 


这 种 方案 也 有 缺点 《除了 增加 内 存 使 用 ) ， 需 要 计数 回收 列表 中 的 结 点 ， 这 
就 意味 着 要 使 用 原子 计数 ， 并 且 多 个 线程 还 在 竞争 访问 此 回收 列表 。 如 果 有 共享 
内 存 ， 就 可 以 用 增加 的 内 存 使 用 换取 一 个 更 好 的 回收 策略 。 每 个 线程 在 线程 本 地 
变量 上 有 自己 的 回收 列表 。 因 此 就 不 需要 用 来 计数 的 原子 变量 以 及 存 取 列表 。 相 
对 的 ， 就 分 配 了 max_hazard_pointers*max_hazard_pointers 个 结 点 。 如 果 线 
程 在 回收 完 它 所 有 的 结 点 前 退出 了 ， 它 们 就 可 以 像 以 前 一 样 存储 在 全 局 列表 中 ， 
并 且 加 入 到 下 一 个 执行 回收 操作 的 线程 的 本 地 列表 中 。 


风险 指针 的 另 一 个 缺点 是 他 们 涉及 到 IBM 提 交 的 专利 申请 外。 如 果 在 一 个 承 
认 此 专利 有 效 的 国家 写 软件 ， 那 么 就 需要 确保 获得 一 个 合适 的 许可 。 一 些 无 锁 内 
存 回 收 机 制 可 以 共用 此 技术 。 这 是 一 个 很 活路 的 研究 领域 ， 很 多 公司 都 在 竭尽 所 
能 地 提交 专利 申请 。 你 可 能 会 提出 这 样 的 疑问 ， 为 什么 我 花 了 这 么 多 篇 幅 介 绍 一 
种 很 多 人 都 不 能 使 用 的 一 种 技术 ， 这 是 一 个 合理 的 问题 。 首 先 ， 有 可 能 在 不 获得 
许可 的 情况 下 使 用 该 技术 。 例 如 ， 如 果 你 在 GPLBI 下 开发 免费 软件 ， 你 的 软件 可 
以 被 IBM 的 非 不 主张 条 款 岂 所 覆盖 。 就 可 以 使 用 该 技术 。 第 二 ， 更 重要 的 一 点 
T a aa 


因此 ， 是 否 存在 可 以 用 在 无 锁 代 码 的 非 专利 内 存 技术 ? 幸运 的 是 ， 确 实 有 。 
一 种 技术 就 是 引用 计数 。 


7.2.4 使 用 引用 计数 检测 结 点 


回顾 7.2.2 节 ， 删 除 结 点 的 问题 就 在 于 检测 哪些 结 点 正在 被 别 的 线程 读 取 。 如 
果 可 以 精确 识别 出 哪些 结 点 正在 被 引用 以 及 何 时 没有 线程 读 取 这 些 结 点 ， 那 么 就 
可 以 删除 此 结 点 。 风 险 指 针 通 过 存储 读 取 每 个 结 点 的 线程 数 来 处 理 此 问题 。 引 用 
技术 通过 存储 一 定数 量 的 线程 读 取 结 点 来 处 理 这 个 问题 。 


这 种 方法 看 上 去 更 好 更 直接 ， 但 是 在 实际 中 很 难处 理 。 首 先 ， 你 可 能 认 
为 std: :shared_ptr<> 可 以 处 理 这 种 问题 ; 毕竟， 这 是 一 个 引用 计数 指针 。 不 垃 
的 是 ， 尽 管 std: :shared_ptr<> 中 的 一 些 操作 是 原子 的 ， 但 是 它们 不 能 保证 是 无 
锁 的 。 尽 管 这 与 原子 类 型 上 的 任何 操作 并 没有 不 同 ， 但 是 在 许多 情况 
下 std: :shared_ptr<> 被 使 用 ， 并 且 使 得 原子 操作 是 无 锁 的 会 导致 使 用 这 个 类 有 
人 花费。 如果 你 的 平台 提供 这 样 一 个 实现 ， 即 
当 std: :atomic is lock free(&some_shared ptr) 返 回 true， 所 有 的 内 存 回 
收 事件 都 离开 。 如 清单 7.9 所 示 ， 其 中 只 使 用 std: :shared_ptr<node>. 


清单 7.9 ”使 用 无 锁 的 std::shared_ptr<> 的 无 锁 栈 实现 


template<typename T> 
class lock free stack 


{ 


private: 


struct node 
std::shared_ptr<T> data; 
std: :shared ptr«node» next; 


node (T const& data ): 
data(std::make shared«T»(data )) 
{} 


um 


std::shared ptr«node» head; 
public: 

void push(T const& data) 

{ 
Std::shared ptr«node» const new node=std::make shared<node> (data); 
new node-»next-head.load(); 
while(!std::atomic compare exchange weak(&head, 

&new node-»next,new node)); 


Std::shared ptr«T» popí) 


Std::shared ptr«node» old head-std::atomic load(&head); 

while(old head && !std::atomic compare exchange weak(&head, 
&old head,old head-»next)); 

return old head ? old head-»data : std::shared_ptr<T>(); 


在 可 能 的 情况 下 ，std: :shared_ptr<> 实 现 不 是 无 锁 的 ， 需 要 手工 处 理 引 用 
计数 。 

一 种 可 能 的 技术 涉及 为 每 个 结 点 使 用 不 止 一 个 而 是 两 个 引用 计数 ， 一 个 内 部 
计数 和 一 个 外 部 计数 。 这 两 个 计数 值 之 和 是 结 点 总 的 引用 数 。 外 部 计数 始终 与 结 
点 指针 在 一 起 ， 并 且 每 次 读 取 指 针 的 时 候 外 部 计数 增 一 。 当 读 取 结 点 结束 时 ， 内 
部 计数 减 一 。 读 取 指 针 这 样 一 个 简单 操作 会 导致 外 部 计数 增 一 ， 并 且 在 此 操作 结 
束 时 内 部 计数 减 一 。 

当 内 部 计数 /指针 对 不 在 需要 时 〈 即 多 个 线程 不 再 访问 结 点 时 ) ， 内 部 计数 增 
加 外 部 计数 的 值 减 一 ， 并 废除 外 部 计数 。 一 旦 内 部 计数 的 值 为 零 ， 就 没有 引用 结 
点 ， 此 时 可 删除 此 结 点 。 使 用 原子 操作 来 更 新 共享 数据 也 是 很 重要 的 。 现 在 我 们 
来 看 一 个 使 用 这 种 技术 来 确保 结 点 只 会 被 安全 收回 的 无 锁 栈 的 实现 。 

更 好 的 内 部 数据 结构 和 push( ) 的 实现 如 清单 7.10 所 示 。 


清单 7.10 在 使 用 两 个 引用 计数 的 无 锁 栈 中 入 栈 结 点 


template<typename T> 
Class lock free stack 


private: 
struct node; 


struct counted node ptr +@ 


{ 


int external count; 
node* ptr; 


struct node 


{ 


std::shared ptr<T> data; 9 
Std::atomic«int» internal count; 


counted node ptr next; «— 


node (T const& data ): 
dataí(std::make shared«T» (data )), 
internal count (0) 
{} 
js 


Std::atomic«counted node ptr» head; 0 


public: 
-lock free stackí) 


{ 
} 


void push(T const& data) «—— 


{ 


while (pop()); 


counted node ptr new node; 

new node.ptr-new node (data); 

new node.external countz1; 

new node.ptr-»next-head.load(); 
while(!head.compare exchange weak (new node.ptr-»next,new node)); 


): 


首先 ， 在 counted_node_ptr 结 构 中 包含 了 外 部 变量 与 结 点 的 指针 @。 在 
node 结 构 体 全 中 将 使 用 counted_node_ptr 类 型 的 next 指 针 以 及 内 部 变量 人 @。 
为 counted_node_ptr 是 一 种 简单 的 结构 ， 因 此 在 std: :atomic<> 模 板 中 使 用 它 
作为 列表 的 头 结 点 @。 


在 这 些 支 持 双 字 比较 和 交换 操作 的 平台 上 ， 这 个 结构 足够 小 ， 使 得 
std::atomic<counted_node_ptr> 是 无 锁 的 。 如 果 不 是 在 你 的 平台 上 ， 那 么 最 
好 使 用 清单 7.9 中 提 到 的 std: :shared_ptr<>， 因 为 当 类 型 太 大 使 得 平台 的 原子 
指令 不 能 实现 时 ，std: :atomic<> 将 使 用 一 个 互 斥 元 来 保证 原子 性 《因此 最 后 使 


得 你 的 “无 锁 ” 算 法 变 成 基于 锁 的 算法 ) 。 或 者 ， 如 果 你 想 限 制 计数 的 位 数 ， 并 且 
你 知道 你 的 平台 中 指针 有 空闲 位 〈 例 如 ， 地 址 空 gz 间 只 有 48 位 但 是 指针 有 64 位 ) ， 
你 可 以 在 单个 字 中 将 计数 存储 在 指针 的 空 几 位 中 。 这 种 方法 需要 与 平台 相关 的 知 
识 ， 这 就 超出 了 本 书 的 范围 了 。 


push() 相 对 简单 一 些 加 .构造 一 个 指向 新 分 配 结 点 的 counted_node_ptr， 
并 将 它 的 next 赋 值 为 当前 的 head。 之 后 用 compare_exchange_weak() 来 给 head 
赋值 ， 就 像 之 前 的 清单 所 示 。 设 置 计数 器 时 ， 将 内 部 计数 设 为 零 ， 外 部 计数 设 为 

。 因 为 这 是 新 创建 的 结 点 ， 只 有 一 个 外 部 引用 “〈 即 head 本 身 ) 。 

同 理 ，pop() 的 实现 也 复杂 了 一 些 ， 如 清单 7.11 所 示 。 


清单 7.11 使 用 两 个 引用 计数 从 无 锁 栈 中 出 栈 一 个 结 点 


template<typename T> 
class lock_free_stack 


{ 


private: 
void increase head count (counted node ptr& old counter) 


{ 


counted node ptr new_counter; 


do 
new_counter=old_counter; 
++new_ counter.external count; 
while(!head.compare exchange strongí(old counter,new counter)); +@ 


old eounter.external count-new counter.external count; 


j 


public: 
std::shared_ptr<T> pop()# 
{ 
counted node ptr old head=head.load() ; 
for(;;) 
{ 
increase head count (old_head) ; 
node* const ptr-old head.ptr; -O 
if (!ptr) 


{ 
} 


return std::shared ptr«T»(); 


if(head.compare exchange strong(old head,ptr-»next)) «e 
{ 
std::shared ptr«T» res; 
res.swap(ptr-»data); 0 
int const count increase-old head.external count-2; «— 
if (ptr->internal_count.fetch_add(count_increase) == 0 


-count increase) 


{ 


} 
return res; +@ 


delete ptr; 


} 


else if (ptr->internal_count.fetch_sub(1)==1) 


{ 
delete ptr; Qo 
} 


y; 


这 里 ， 一 旦 你 载 入 了 head 的 值 ， 就 必须 将 引用 此 head 结 点 的 外 部 计数 的 值 增 
一 ， 用 以 表明 你 引用 了 此 结 点 并 且 确 保 解 引用 是 安全 的 。 如 果 在 增加 引用 计数 前 
解 引 用 此 指针 ， 那 么 另 一 个 线程 就 可 以 在 你 读 取 这 个 结 点 前 释放 该 结 点 ， 因 此 使 
得 它 变 成 悬挂 指针 。 这 是 使 用 两 个 分 开 的 引用 计数 的 主要 原因 。 通 过 增加 外 部 引 
用 计数 ， 就 可 以 保证 直到 你 访问 时 指针 仍然 是 有 效 的 。 

在 compare_exchange_strong() 循 环 内 部 增加 计数 的 值 @， 确 保 了 没有 别 的 线 
程 在 此 时 改变 它 。 


一 旦 增加 了 计数 ， 为 了 访问 它 指 辣 的 结 点 ， 可 以 安全 解 引 用 从 head 载 入 的 
ptr 的 值 信 。 如 果 指 针 为 空 ， 表 明 位 于 链表 的 尾部 没有 位 置 了 。 如 果 指 针 不 为 
空 ， 就 可 以 通过 在 head 上 调用 compare_exchange_strong() 来 移动 结 点 @。 


如 果 compare_exchange_strong() 成 功 了 ， 就 可 以 拥有 该 结 点 ， 并 且 交 换 
出 data 以 备 以 后 返回 它 例 。 这 就 确保 了 就 算 别 的 线程 读 取 栈 的 时 候 一 直 持 有 指向 
此 结 点 的 指针 ，data 也 不 需要 一 直 保持 。 然 后 就 可 以 使 用 原子 操作 fetch_add 将 
结 点 外 部 计数 的 值 加 到 内 部 计数 上 @。 如 果 当 前 引用 计数 的 值 为 零 ， 那 么 先前 你 
增加 的 值 〈 即 fetch_add 的 返回 值 ) 束 是 负数 ， 此 时 就 可 以 删除 这 个 结 点 。 请 注 
意 你 增加 的 值 比 外 部 计数 的 值 减 少 2@。 你 已 经 从 列表 中 移出 了 结 点 ， 因 此 计数 
减 一 ， 并 且 这 个 线程 不 在 读 取 这 个 结 点 ， 因 此 计数 的 值 再 次 减 一 。 无 论 是 否 删 除 
此 结 点 ， 程 序 都 结束 了 ， 因 此 可 以 返回 data@。 


如 果 比 较 / 交 换 @ 失 败 了 ， 则 表明 在 此 之 前 另 一 个 线程 移动 了 该 结 点 ， 或 者 另 
一 个 线程 入 栈 了 一 个 新 结 点 。 不 管 怎样 ， 你 都 需要 用 比较 /交换 返回 的 head 新 值 
重新 开始 。 但 是 首先 你 必须 减少 你 试图 移动 的 结 点 的 引用 计数 。 该 线程 不 会 再 读 
取 它 了 。 如 果 这 是 持 有 引用 的 最 后 一 个 线程 《因为 另 一 个 线程 将 它 从 栈 中 移 
IH) ， 那 么 内 部 引用 计数 的 值 为 一 ， 因 此 减少 一 将 使 得 值 变 为 零 。 在 这 种 情况 
下 ， 可 以 在 循环 之 前 删除 此 结 点 人 @。 


迄今 为 止 ， 所 有 原子 操作 使 用 了 默认 的 std: :memory_order_seq_cst 内 存 
顺序 。 在 大 多 数 系 统 中 ， 这 种 方法 比 别 的 内 存 顺 序 消 耗 更 多 的 执行 时 间 以 及 同步 
开销 。 现 在 ， 你 有 决定 数据 结构 逻辑 的 权利 ， 就 可 以 考虑 放松 一 些 内 存 顺 序 要 
求 。 可 以 减少 使 用 栈 的 不 必要 的 开销 。 因 此 ， 先 不 考虑 栈 ， 考 虑 一 下 无 锁 队 列 的 
设计 。 检 查 栈 操作 并 问 问 自己 ， 对 于 一 些 操作 是 否 可 以 使 用 更 简单 的 内 存 顺序 并 


且 获 得 同样 的 安全 性 ? 
72.5 将 内 存 模型 应 用 至 无 锁 栈 


在 改变 内 存 顺序 前 ， 你 需要 检查 操作 以 及 它们 之 间 的 关系 。 然 后 就 可 以 寻找 
提供 这 些 关 系 的 最 小 内 存 顺序 。 为 了 实现 这 一 点 ， 就 必须 在 不 同 场景 下 从 线程 角 
度 考 虑 情况 。 最 简单 的 场景 就 是 一 个 线程 入 栈 一 个 数据 项 ， 并 且 稍 后 妃 一 个 线程 
将 那个 数据 项 出 栈 ， 我 们 先 考 虑 这 种 情况 。 


在 这 种 简单 情况 下 ， 涉 及 数据 的 三 个 重要 部 分 。 第 一 部 分 是 用 来 传输 head 数 
据 的 counted_node_ptr。 第 二 部 分 是 head 引 用 的 结 点 数据 结构 。 第 三 部 分 是 结 
点 指向 的 数据 项 。 


线程 push( ) 的 时 候 首 先 构 造 数 据 项 和 结 点 ， 然 后 设置 head。 线 程 pop() 的 时 
候 首 先 加 载 head 的 值 ， 然 后 基于 head 做 一 个 比较 /交换 循环 来 增加 引用 计数 ， 最 
后 读 取 结 点 数据 结构 来 得 到 next 的 值 。 在 这 里 可 以 看 出 这 样 一 种 关系 ，next 的 值 
是 一 个 普通 的 非 原子 性 对 象 ， 因 此 为 了 安全 读 取 它 ， 必 须 存在 存储 (入 栈 线程 执 
行 的 操作 〉 发 生 在 加 载 ( 出 栈 线程 执行 的 操作 ) 之 前 这 样 一 种 关系 。 因 为 push() 
中 唯一 的 原子 操作 是 compare_exchange_weak()， 所 以 需要 一 个 释放 操作 来 实 
现在 线程 间 实 现 这 样 一 种 先后 顺序 关系 ， 而 且 compare_exchange_weak() 必 须 
是 std: :memory_order_release 或 者 更 强 的 。 如 果 compare_exchange_weak() 
失败 了 ， 那 么 就 继续 循环 并 且 不 做 任何 改变 ， 因 此 在 这 种 情况 下 需要 使 


Histd::memory order relaxed. 


void push(T const& data) 


{ 
counted node ptr new node; 
new node.ptr-new node (data); 
new node.external countz1; 
new node.ptr-»next-head.load(std::memory order relaxed) 
while(!head.compare exchange weak (new node.ptr-»next,new node, 
std::memory order release,std::memory order relaxed)); 
} 


那么 pop() 的 代码 怎么 样 呢 ? 为 了 实现 这 种 先后 顺序 关系 ， 你 必须 在 读 取 
next 之 前 有 一 个 std: :memory_order_acquire 或 者 更 强 的 操作 。 解 引用 指针 读 
取 的 next 值 是 increase_head_count() 中 的 compare_exchange_strong() 读 
取 的 旧 值 。 因 此 如 果 成 功 的 话 就 需要 有 先后 顺序 。 正 如 在 push() 中 一 样 ， 如 果 交 
换 失 败 的 话 ， 只 需要 继续 循环 ， 因 此 失败 时 可 以 使 用 任意 的 顺序 。 


void increase head count (counted node ptr& old counter) 


{ 


counted node ptr new counter; 


do 
new counter-old counter; 
-4new counter.external count; 


while(!head.compare exchange strongí(old counter,new counter, 
Std::memory order acquire,std::memory order relaxed)); 


old counter.external count-znew counter.external count; 


如 果 compare_exchange_strong() 调 用 成 功 ， 那 么 读 取 的 结 点 的 ptr 值 设置 
为 o1d_counter 中 存储 的 值 。 因 为 push() 中 的 存储 是 一 个 释放 操作 ， 并 
且 compare_exchange_strong() 是 一 个 获取 操作 ， 因 此 存储 与 加 载 同步 而 且 存 
在 先后 发 生 顺 序 的 关系 。 所 以 ，push() 中 存储 ptr 发 生 在 pop() 中 读 取 ptr- 
>next 之 后 ， 因 此 是 安全 的 。 


注意 ， 在 最 初 的 head.1oad() 中 内 存 顺序 并 不 是 很 重要 ， 因 此 可 以 安全 使 


用 std: :memory_order_relaxed. 


下 一 步 ，compare_exchange_strong() 将 head 的 值 设 为 ol1d_head.ptr- 
>next。 是 否 需要 操作 来 确保 线程 的 数据 完整 性 ? 如 果 交 换 成 功 就 读 取 ptr- 
>data， 此 时 就 需要 确保 在 线程 中 push() 存 储 ptr->data 的 操作 发 生 在 线程 加 载 
它 之 前 。 尽 管 如 此 ， 你 已 经 得 到 如 下 保证 ，increase_head_count() 中 的 获取 
操作 保证 了 push() 线 程 中 的 存储 和 比较 /交换 操作 存在 同步 关系 。 因 为 push() 线 
程 中 存储 data 发 生 在 存储 head 之 前 ， 调 用 increase_head_count() 发 生 在 加 
载 ptr->data 之 前 ， 所 以 就 存在 一 种 先后 顺序 关系 。 并 且 即 使 pop() 中 的 比较 / 交 
换 使 用 std: :memory_order_relaxed， 这 种 先后 顺序 关系 也 是 存在 的 。ptr- 
>data 改 变 的 唯一 的 地 方 就 是 调用 swap()， 并 且 没 有 别 的 线程 可 以 在 同一 个 结 点 
上 进行 操作 ， 这 就 是 整个 比较 /交换 。 


如 果 compare_exchange_strong() 失 败 了 ， 直 到 下 一 次 循环 的 时 候 才 会 访 
问 o1d_head 的 新 值 。 并 且 你 决定 了 increased_head_count() 中 的 
std: :memory_order_acquire 是 足够 的 ， 因 此 std: :memory_order_relaxed 


也 是 足够 的 。 


那么 其 他 线程 呢 ? 是 否 需 要 更 强 的 方式 来 保证 别 的 线程 是 安全 的 ? 答 
定 的 。 因为 只 有 比较 /交换 操作 会 改变 head。 因 为 这 些 是 “ 读 一 修改 一 写 B v5 
们 通过 push() 中 的 比较 /交换 形成 了 部 分 释放 顺序 。 因 此 ，push() 中 的 


compare exchange | weak( ) 与 调用 increase_ head_count() 中 的 


compare_exchange_strong() 同 步 ， 它 读 取 存储 的 值 ， 即 使 别 的 线程 同时 在 修 
改 head。 


因此 ， 你 基本 上 完成 了 ， 只 需要 处 理 修改 引用 计数 的 fetch_add() 的 操作 。 
返回 这 个 结 点 数据 的 线程 可 以 继续 ， 因 为 没有 别 的 线程 会 修改 这 个 结 点 数据 。 尽 
管 如 此 ， 任 何 没有 成 功 取 值 的 线程 知道 别 的 线程 的 确 修改 了 结 点 数据 ， 它 使 
用 swap() 获 得 引用 的 数据 项 。 因 此 ， 为 了 避免 数据 竞争 ， 你 需要 确保 swap() 发 
生 在 delete 之 前 。 实 现 它 的 一 个 简单 方式 就 是 在 成 功 返 回 分 文 的 fetch_add() 中 
使 用 std: :memory_order_ release， 并 且 在 再 次 循环 分 支 的 fetch_add() 中 使 
用 std: :memory_order_acquire。 还 可 以 进一步 简化 设计 ， 只 有 一 个 线程 进行 
删除 操作 “〈 将 计数 设置 为 零 的 线程 )》 ， 也 只 有 此 线程 需要 进行 获取 操作 。 因 
为 fetch_add() 是 一 个 “ 读 一 修改 一 写 ” 操 作 ， 它 组 成 了 释放 顺序 的 一 部 分 ， 因 此 
可 以 使 用 额外 的 load()。 如 果 再 次 循环 分 文 将 引用 计数 减 为 零 ， 那 么 为 了 保证 同 
步 关 系 可 以 使 用 std: :memory_order_acquire 来 重 载 引 用 计数 ， 并 
且 fetch_add() 可 以 使 用 std: :memory_order_relaxed。 清 单 7.12 所 示 就 是 使 
用 新 的 pop() 的 栈 的 最 终 实现 。 


清单 7.12 ”使 用 引用 计数 和 放松 原子 操作 的 无 锁 栈 


template<typename T> 
class lock free stack 
{ 
private: 

struct node; 


struct counted_node_ptr 


{ 


int external count; 
node* ptr; 


s 
struct node 


{ 


std::shared_ptr<T> data; 
std::atomic<int> internal_count; 
counted node ptr next; 


node (T const& data ): 
dataí(std::make shared«T»(data )), 
internal count (0) 


H4 
Ja 


std::atomic«counted node ptr» head; 


void increase head countí(counted node ptr& old counter) 


{ 


counted node ptr new_counter; 


do 


{ 


} 


public: 


new_counter=old_counter; 
++new counter.external count; 
while(!head.compare exchange strong(old counter,new counter, 
Std::memory order acquire, 
Std::memory order relaxed)); 


old counter.external count=new counter.external count; 


-lock free stack(í) 


{ 
} 


while (pop()); 


void push(T const& data) 


{ 


std 


counted node ptr new node; 

new node.ptr-new node (data); 

new node.external count-1; 

new node.ptr-»next-head.load(std::memory order relaxed) 

while(!head.compare exchange weak (new node.ptr-»next,new node, 
Std::memory order release, 
std::memory order relaxed)); 


::Shared ptr«T» pop() 


counted node ptr old head- 
head.load(std::memory order relaxed); 
for(;;) 
{ 
increase_head_count (old_head) ; 
node* const ptr-old head.ptr; 
if(!ptr) 


{ 
} 


if (head.compare exchange strong(old head,ptr-»next, 
std: :memory_order_relaxed) ) 


return std::shared_ptr<T>(); 


{ 


Std::shared ptr«T» res; 
res.swap(ptr-»data); 


int const count increase-old head.external count-2; 


if(ptr-»internal count.fetch add(count increase, 
Std::memory order release)---count increase) 
{ 


} 


return res; 


delete ptr; 


} 


else if(ptr-»internal count.fetch add(-1, 
std::memory order relaxed)--1) 
{ 


ptr-»internal count.load(std::memory order acquire); 
delete ptr; 


} 
}; 


这 是 一 个 实验 ， 但 是 最 后 成 功 了 。 通 过 使 用 更 放松 的 操作 ， 在 没有 影响 正确 
性 的 情况 下 提升 了 性 能 。 正 如 你 所 见 ， 这 里 的 pop() 实 现 有 37 行 代码 ， 在 清单 6.1 
基于 锁 的 栈 中 pop() 有 8 行 代码 ， 在 清单 7.2 不 使 用 内 存 管理 的 无 锁 栈 中 pop() 有 7 
行 代码 。 现 在 我 们 考虑 写 一 个 无 锁 队 列 ， 你 可 以 看 到 一 个 相似 的 模式 ， 无 锁 代码 
中 的 很 多 复杂 性 都 来 自 于 管理 内 存 。 


7.2.6 ”编写 不 用 锁 的 线程 安全 队列 


队列 与 栈 有 所 不 同 。 因 为 队列 中 push() 和 pop() 操 作 读 取 了 数据 结构 的 不 同 
部 分 ， 而 栈 中 这 两 个 操作 读 取 了 相同 的 头 结 点 。 所 以 同步 要 求 就 不 一 样 了 。 你 需 
要 确保 一 端 所 作出 的 改变 能 被 另 一 端正 确 地 读 取 。 尽 管 如 此 ， 清 单 6.6 中 队列 的 
try, pop ) 结 构 与 清单 7.2 简 单 无 锁 栈 中 的 pop() 区 别 并 不 是 很 大 ， 因 此 可 以 合理 
假设 无 锁 代 码 不 会 不 相似 。 

如 果 以 清单 6.6 作 为 基础 ， 就 需要 两 个 结 点 指针 ， 一 个 指针 指向 head， 一 个 指 
针 指 向 tail。 多 个 线程 将 会 读 取 它们 ， 为 了 去 掉 相关 的 互 斥 元 ， 最 好 是 原子 操 
作 。 下 面 我 们 来 做 一 些小 的 改变 来 看 看 效果 如 何 。 清 单 7.13 展 示 了 效果 。 


清单 7.13 单 生产 者 单 消费 者 的 无 锁 队列 


template<typename T> 
class lock free queue 
private: 
struct node 
std::shared_ptr<T> data; 
node* next; 


node () : 
next (nullptr) 
{} 


bi 


std::atomic«<node*> head; 
std::atomic«node*-» tail; 


node* pop head() 


{ 


node* const old head-head.1load(); 
if (old head--tail.load()) — 
{ 


} 


head. store (old_head--»next) ; 
return old_head; 


return nullptr; 


} 


public: 


lock free queue(): 
head (new node),tail(head.load()) 


{} 


lock_free_queue(const lock free queue& other)-delete; 
lock free queue& operator-(const lock free queue& other)-delete; 


~lock free queue() 


{ 


while (node* const old head-head.load()) 


{ 


head. store (old_head- >next) ; 
delete old_head; 


} 


std::shared_ptr<T> pop() 


{ 


node* old head-pop head(); 
if(!old head) 


{ 
} 


std::shared_ptr<T> const resí(old head-»data); 0O 
delete old head; 
return res; 


return std::shared ptr«T»(); 


} 


void push(T new_value) 


{ 


std::shared_ptr<T> new data(í(std::make shared«T» (new value)); 


node* p-new node; 

node* const old tail-tail.load(); «o o°? 
old_tail->data.swap (new_data) ; 

old tail-»next-p; 0O 


tail.store (p); c 


看 起 来 似乎 没什么 不 好 。 如 果 一 次 只 有 一 个 线程 调用 push()， 并 且 只 有 一 个 
线程 调用 pop()， 就 工作 的 很 好 了 。 在 这 种 情况 下 ， 重 要 的 是 push() 和 pop() 的 
发 生 顺 序 关系 以 确保 可 以 安全 获取 data。tail 存 储 @ 与 tail 加 载 @ 同 时 发 生 ; 
存储 先前 结 点 的 data 指 针 全 发 生 在 存储 tail 之 前 ; 加 载 tail 发 生 在 加 载 data 指 
针 之 前 人 @， 因 此 存储 data 发 生 在 加 载 之 前 ， 这 就 是 安全 的 。 这 是 一 个 性 能 良好 的 
单 生 产 者 、 单 消费 者 (single-producer, single-consumer, SPSC) 队列 。 


当 多 个 线程 同时 调用 push( ) 或 多 个 线程 同时 调用 pop( ) 的 时 候 就 会 存在 问 
题 。 首 先 来 看 push()。 如 两 个 线程 同时 调用 push()， 它 们 都 会 分 配 新 节点 作为 
新 的 哑 元 结 点 @， 都 会 读 取 相同 的 tail@， 并 且 设 置 date 和 next 指 针 @、@H 时 
都 会 同时 更 新 同一 个 结 点 的 数据 成 员 。 这 就 是 数据 竞争 ! 


pop_head() 中 也 存在 类 似 的 问题 。 如 果 两 个 线程 同时 调用 pop_head， 就 会 
读 取 同一 个 head， 并 且 会 用 同一 个 next 指 针 覆 盖 旧 值 。 这 两 个 线程 现在 认为 他 们 
得 到 了 相同 的 结 点 一 一 这 是 有 很 大 危害 的 。 你 不 但 要 确保 只 有 一 个 线程 pop() 结 
点 ， 并 且 需 要 确保 别 的 线程 可 以 安全 访问 head 的 下 一 个 结 点 。 这 就 是 无 锁 栈 的 
pop() 遇 到 的 问题 ， 因 此 很 多 方法 可 以 用 在 这 里 。 


如 果 pop() 是 一 个 “已 解 决 的 问题 "那么 push() 呢 ?问题 就 是 为 了 得 
到 push() 和 pop() 的 先后 顺序 关系 ， 需 要 在 更 新 tail 前 设置 哑 元 结 点 的 数据 项 。 这 
就 意味 着 同时 调用 push() 会 在 这 些 相 同 的 数据 项 上 产生 竞争 ， 因 为 他 们 读 取 了 相 
同 的 tail 指 针 。 


1. 处理 pushO 中 的 多 个 线程 


一 种 选择 是 在 真正 的 结 点 间 增 加 一 个 旺 元 结 点 。 这 样 ， 当 前 tail 结 点 只 需要 
更 新 它 的 next 指 针 ， 因 此 可 以 是 原子 的 。 如 果 一 个 线程 成 功 地 将 它 的 next 指 针 从 
空 改 变 为 新 结 点 ， 就 代表 它 成 功 地 增加 了 指针 ;否则 ， 它 就 必须 再 次 开始 并 且 重 
新 读 取 tail。 这 就 需要 对 稍微 改变 pop( ) 来 丢弃 有 空 数据 指针 的 结 点 ， 并 且 再 次 
循环 。 缺 点 就 是 每 次 调用 pop( ) 都 会 移出 两 个 结 点 ， 并 且 会 有 两 倍 内 存 分 配 。 


第 二 种 选择 是 使 得 data 指 针 是 原子 的 ， 并 且 调 用 比较 /交换 来 设置 它 。 如 果 
调用 成 功 ， 那 么 这 就 是 tail 结 点 ， 并 且 可 以 安全 地 将 next 指 针 设置 为 新 结 点 ， 然 
后 更 新 tail。 如 果 另 一 个 线程 已 经 存储 了 此 数据 ， 导 致 比较 /交换 失败 了 ， 那 么 
就 再 次 循环 ， 重 新 读 取 tail1 然 后 重新 开始 。 如 果 std: :shared_ptr<> 的 原子 操 
作 是 无 锁 的 ， 那 么 整个 就 是 无 锁 的 。 如 果 不 是 ， 就 需要 别 的 方法 。 一 种 可 能 就 是 
让 pop() 返 回 std: :unique_ptr<>《〈 毕 竟 ， 这 是 对 象 的 唯一 引用 ) 并 且 将 数据 用 
普通 指针 存储 在 队列 里 。 这 就 允许 你 将 它 存储 为 std: :atomic<T#>， 这 样 你 就 可 
以 使 用 compare_exchange_strong()。 如 果 你 使 用 清单 7.11 中 的 引用 计数 方法 
在 多 线程 的 情况 下 处 理 pop()， 那 么 push() 就 如 清单 7.14 所 示 。 


清单 7.14 首次 (很 进 的 ) 尝试 修订 push() 


void push(T new value) 
std::unique ptr<T> new data(new T(new value) ); 
counted node ptr new next; 
new next .ptr=new node; 
new next .external count-1; 


fort: 
{ 
node* const old tail-tail.load(); +@ 
T* old data=nullptr; 
if (old tail-»data.compare exchange strong ( 
old_data,new_data.get ())) 
{ 
old tail-»next-new next; 
tail.store(new next.ptr); «e 
new data.release(); 
break; 
} 
} 


使 用 引用 计数 方法 避免 了 特定 的 竞争 ， 但 是 这 不 是 push() 中 唯一 的 竞争 。 如 
果 你 看 看 清单 7.14 中 push() 的 修订 版 本 ， 束 会 发 现 栈 中 有 这 样 一 段 代 码 : 加 载 一 
个 原子 指针 @ 并 且 解 引用 那个 指针 人 @。 同 时 ， 男 一 个 线程 可 以 更 新 那个 指针 人 @， 
最 后 指向 再 分 配 的 结 点 (在 pop() 中 ) 。 如 果 在 你 解 引用 那个 指针 前 再 分 配 那 个 
结 点 ， 就 会 产生 不 确定 的 行为 。 天 哪 ! 它 试 图 像 head 一 样 在 tail 中 增加 一 个 外 部 
计数 ， 但 是 每 个 结 点 在 队列 先前 的 结 点 的 next 指 针 中 己 经 有 一 个 外 部 计数 了 。 同 
一 个 结 点 拥有 两 个 外 部 计数 就 意味 着 要 需要 修改 引用 计数 方法 来 避免 太 早 删 除 该 
结 点 。 你 可 以 这 样 处 理 ， 即 在 node 结 构 体 中 计算 外 部 计数 的 数量 ， 并 且 当 每 个 外 
部 计数 被 销毁 的 时 候 《〈 以 及 将 相关 的 外 部 计数 加 到 内 部 计数 的 时 候 ) 减少 它 的 数 
量 。 如 果 结 点 的 内 部 计数 为 零 并 有 旦 没有 外 部 计数 ， 此 时 就 可 以 安全 删除 该 结 点 。 
最 初 我 是 从 Joe Seigh 的 Atomic Ptr Plus 项 目 喇 了解 到 的 技术 。 清 单 7.15 给 出 了 使 用 
这 种 方法 的 push( ) 。 


清单 7.15 ”在 无 锁 队 列 中 用 引用 计数 tail 来 实现 push() 


template<typename 工 > 
class lock free queue 


{ 


private: 
struct node; 


struct counted node ptr 


{ 


int external count; 
node* ptr; 


i 


Std::atomic«counted node ptr» head; 
std::atomic«counted node ptr» tail; 0 


struct node_counter 
unsigned internal_count:30; 
unsigned external_counters:2; -© 


}; 


struct node 
std::atomic«T*» data; 
std::atomic<node counter> count; «e 
counted node ptr next; 


node () 
node counter new count; 
new count.internal count-0; 
new count.external counters-2; —0 
count.store(new count); 


next.ptr-nullptr; 
next.external count-0; 


h 


public: 

void push(T new value) 

{ 
std::unique_ptr<T> new_data(new T(new_value) ); 
counted node ptr new_next; 
new next.ptr-new node; 
new next.external count-1; 
counted node ptr old tail-tail.load(); 


ford; 


{ 


increase external count (tail,old_tail); -© 


T* old data-nullptr; 
if(old tail.ptr-»data.compare exchange strong( «o 
old data,new data.getí))) 


old tail.ptr-»next-new next; 

old tail-tail.exchange (new next); 

free external counter(old tail); «9 
new data.release(); 

break; 


} 


old tail.ptr-»release ref(); 


清单 7.15 中 ，tail 和 head 一 样 都 是 atomic<counted_node_ptr>@, 并 

且 node 有 一 个 count 成 员 代 蔡 了 之 前 的 internal_count 候 .count 是 包 

含 internal_count 和 额外 的 external_counters 成 员 人 @ 的 结构 体 。 注 意 这 里 的 
external_counters 只 包含 两 个 比特 ， 因 为 最 多 只 有 两 个 计数 器 。 通 过 使 用 一 个 
比特 来 表示 它 ， 并 且 internal_count 是 一 个 30 比 特 的 值 ， 总 的 计数 器 大 小 可 以 
保持 32 比 特 。 这 就 使 得 在 确保 整个 结构 体 在 32 比 特 和 64 比 特 的 机 器 上 都 能 用 一 个 
机 器 字 表 示 的 情况 下 ， 还 能 有 足够 的 范围 来 表示 比较 大 的 内 部 计数 值 。 为 了 避免 
竞争 条 件 ， 将 这 些 计 数 作为 一 个 值 来 更 新 是 很 重要 的 ， 稍 后 你 将 看 到 。 将 此 结构 
体 保存 在 一 个 机 器 字 中 在 许多 平台 中 使 原子 操作 更 容易 是 无 锁 的 。 


node 初 始 化 的 时 候 ，internal_count 被 设 为 零 ，external_counters 的 值 
设 为 2@。 因 为 一 旦 你 将 结 点 添加 到 队列 中 ， 每 个 新 结 点 都 会 引用 tail 以 及 先前 
结 点 的 next 指 针 。push() 与 清单 7.14 中 类 似 ， 除 了 你 为 了 调用 结 点 data 成 员 的 
compare_exchange_strong() 而 解 引用 从 tail 加 载 的 值 之 外 @， 你 还 调用 一 个 
新 阔 数 increase_external_count() 来 增加 计数 @， 并 且 之 后 在 旧 的 tail 上 调 


Hjfree external counter()Q. 


处 理 好 push() 之 后 ， 我 们 来 看 看 pop() 。 清 单 7.16 展 示 了 它 ， 并 且 将 清单 
7.11 中 pop() 实 现 的 引用 计数 逻辑 与 清单 7.13 中 的 队列 pop 逻 辑 结 合 在 一 起 。 


清单 7.16 从 使 用 引用 计数 tail 的 无 锁 队 列 中 将 结 点 出 队列 


template<typename T> 
class lock free queue 
{ 
private: 
struct node 
{ 
void release ref (); 
H 
public: 
Std::unique ptr«T» pop() 
{ 
counted node ptr old head-head.load(std::memory order relaxed); +@ 
for(;;) 
{ 
increase external count (head,old head); -© 
node* const ptr-old head.ptr; 
if (ptr==tail.load(}.ptr) 


{ 


ptr-»release ref(); «9 


return std::unique ptr«T»(); 


if(head.compare exchange strong(old head,ptr-»next)) «à o 


{ 


T* const res-ptr-»data.exchange (nullptr) ; 
free external counteriold head); +@ 
return std::unique ptr<T>(res) ; 

} 

ptr-»release refí(); 0O 


你 在 开始 循环 前 @ 以 及 增加 加 载 值 的 外 部 引用 前 @ 加 载 old_head 值 。 如 果 
head 与 tail 是 同一 个 结 点 ， 那 么 就 可 以 释放 该 引用 全 并且 返 回 一 个 空 指针 ， 因 为 
队列 中 没有 数据 。 如 果 队 列 中 有 数据 ， 你 就 想 获 得 此 数据 ， 并 且 调 
用 compare_exchange_strong() 来 实现 @@。 如 同 清 单 7.11 中 的 栈 一 样 ， 它 将 外 
部 计数 和 指针 作为 一 个 值 来 比较 ， 如 果 任 何 一 个 改变 了 ， 就 在 释放 引用 后 重新 循 
环 @。 如 果 compare_exchange_strong() 成 功 了 ， 你 就 获得 了 结 点 中 的 数据 ， 
因此 在 你 释放 移出 的 结 点 的 外 部 计数 后 ， 可 以 将 此 值 返 回 给 调用 者 人 @。 一 旦 外 部 
引用 计数 都 被 释 放 了 并 且 内 部 计数 值 变 为 零 ， 就 可 以 删除 结 点 了 。 清 单 7.17、 清 
单 7.18 和 清单 7.19 展 示 了 处 理 这 些 的 引用 计数 函数 。 


清单 7.17 释放 无 锁 队 列 的 结 点 引用 


template<typename T> 
class lock free queue 


{ 


private: 


struct node 


{ 


) 
): 


void release ref() 


{ 


node counter old counter- 
count.load(std::memory order relaxed); 
node counter new counter; 


do 

new counter-old counter; 

--new counter.internal count; 0 
while(!count.compare exchange strong( + 人 © 


old counter,new counter, 
std::memory order acquire,std::memory order relaxed)); 


if(inew counter.internal count && 
Inew_counter.external counters) 


delete this; e 
) 


node: :release_ref() 的 实现 只 在 清单 7.11 的 lock free stack::pop() E 
改变 了 一 些 对 应 的 代码 。 清 单 7.11 中 的 代码 只 需要 处 理 一 个 外 部 计数 ， 因 此 可 以 
用 一 个 简单 fetch_sub。 而 现在 即使 只 想 修改 internal_count 域 ， 也 需要 原子 
更 新 整个 count@。 因 此 需要 一 个 比较 /交换 循环 全。 一 旦 你 减 
少 internal_count， 如 果 内 部 计数 和 外 部 计数 都 变 为 零 ， 那 么 这 就 是 最 后 一 个 
引用 ， 就 可 以 安全 删除 该 结 点 了 全。 


清单 7.18 在 无 锁 队 列 中 获得 结 点 的 新 引用 


template<typename T> 
class lock free queue 


{ 


private: 
Static void increase external count( 
Std::atomic«counted node ptr»& counter, 
counted node ptr& old counter) 


counted node ptr new counter; 


do 


{ 


new_counter=old_counter; 
-«new counter.external count; 


) 


whileí(lcounter.compare exchange strong(í 
old counter,new counter, 
Std::memory order acquire,std::memory order relaxed)); 


old counter.external countznew counter.external count; 


y; 


清单 7.18 则 相反 。 这 次 ， 你 得 到 一 个 新 的 引用 并 且 增 加 外 部 计数 ， 而 不 是 释 
放 一 个 引用 。increase_external_count() 与 清单 7.12 中 的 
increase_head_count() 函 数 类 似 ， 除 了 它 使 用 一 个 静态 成 员 函 数 来 将 外 部 计 
数 作为 第 一 个 参数 来 更 新 ， 而 不 是 在 固定 计数 器 上 进行 操作 。 


清单 7.19 ”在 无 锁 队 列 中 释放 结 点 的 外 部 计数 


template<typename T> 
class lock free queue 
{ 
private: 
static void free_external_counter (counted_node_ptr &old_node_ptr) 
node* const ptr=old node ptr.ptr; 
int const count_increase=old_node_ptr.external_count-2; 


node counter old counter- 
ptr-»count.loadí(std::memory order relaxed); 


node counter new counter; 
do 
new counter-old counter; . 
--new counter.external counters; 
new counter.internal count-«-count increase; c. 
while(!ptr-»count.compare exchange strong(í «e 
old counter,new counter, 
std: :memory order acquire,std::memory order relaxed)); 


if(!new counter.internal count && 
Inew_ counter.external counters) 


delete ptr; —0 


{ 
} 


与 increase_external_count() 相 对 的 是 free_external_counter()。 这 
与 清单 7.11 中 lock_free_stack: :pop() 的 对 应 代码 是 类 似 的 ， 但 是 被 修改 为 可 
以 处 理 external_counters 计 数 。 它 在 整个 count 上 使 用 单 
个 compare_exchange_strong() 来 处 理 两 个 计数 @， 正 如 你 在 release_ref() 
中 减少 internal_count 所 做 的 一 样 。 正 如 清单 7.11 一 样 ，internal_count 的 值 
被 更 新 了 介 ， 并 且 external_counters 的 值 减 少 1@。 如 果 这 两 个 值 现在 都 为 
零 ， 那 么 此 结 点 就 没有 引用 ， 因 此 可 以 安全 删除 它 人 @。 这 需要 作为 一 个 操作 来 执 
行 〈《 因 此 需要 比较 /交换 循环 ) 以 避免 竞争 条 件 。 如 果 分 别 更 新 这 两 个 值 ， 那 么 两 
o eer 个 线程 ， 因 此 都 删除 这 个 结 点 ， 这 就 会 导致 

定义 的 行为 。 


尽管 这 种 方法 是 有 效 的 并 且 是 无 竞争 的 ， 但 是 它 有 性 能 问题 。 一 旦 一 个 线程 
通过 成 功 完成 old_tail.ptr->data 上 的 compare_exchange_strong()【〔 如 清 
单 7.15 中 人 @ 所 示 )〉 ， 开 始 执行 push() 操 作 。 此 时 没有 线程 可 以 执行 push() 操 作 。 
任何 试图 执行 push( ) 操 作 的 线程 都 会 看 到 新 值 而 不 是 nullptr， 这 就 使 得 
compare_exchange_strong() 失 败 并 且 使 得 线程 再 次 循环 。 这 是 一 个 忙 则 等 待 
现象 ， 会 消耗 CPU 周 期 而 没有 任何 收益 。 因 此 ， 这 是 一 个 锁 。 第 一 个 调用 push() 
的 线程 阻塞 别 的 线程 ， 直 到 它 完 成 了 操作 。 因 此 这 个 代码 不 是 无 锁 的 。 正 常情 况 
下 ， 当 线程 阻塞 时 ， 操 作 系统 可 以 给 拥有 互 斥 锁 的 线程 优先 权 。 但 是 在 这 里 操作 
系统 却 无 法 给 拥有 互 斥 锁 的 线程 优先 权 ， 因 此 阻塞 的 线程 会 一 直 消 耗 CPU 周 期 直 
到 第 一 个 线程 完成 操作 。 这 就 需要 下 一 个 方法 ， 等 待 的 线程 可 以 帮助 正在 执 
行 push( ) 操 作 的 线程 。 


2. 通过 协助 男 一 个 线程 使 得 队列 无 锁 


为 了 使 代码 无 锁 ， 就 需要 找到 一 种 方法 使 得 即使 执行 push() 操 作 的 线程 拖延 
了 ， 等 待 的 线程 依然 可 以 继续 执行 。 一 种 方法 就 是 帮助 拖延 的 线程 做 它 要 完成 的 


TE 


在 这 种 情况 下 ， 你 清楚 地 知道 将 要 做 哪些 操作 。tail 的 next 指 针 需 要 指 问 一 
个 新 的 哑 元 结 点 ， 然 后 更 新 tail 指 针 。 哑 元 结 点 是 没有 区 别 的 ， 因 此 无 论 是 使 用 
成 功 将 数据 入 队列 的 线程 创造 的 哑 元 结 点 ， 还 是 使 用 等 待 将 数据 入 队列 的 线程 创 
造 的 哑 元 结 点 ， 都 是 可 以 的 。 如 果 使 得 结 点 的 next 指 针 成 为 原子 的 ， 就 可 以 使 
用 compare_exchange_strong() 来 设置 该 指针 。 一 旦 设置 好 next 指 针 ， 就 可 以 
在 确保 它 仍然 引用 同一 个 最 初 的 结 点 的 情况 下 ， 使 
用 compare_exchange_weak() 循 环 来 设置 tai1l。 如 果 它 没有 引用 同一 个 最 初 的 
结 点 ， 那 么 就 表示 别 的 线程 已 经 更 新 它 了 ， 此 时 就 停止 尝试 并 且 再 次 循环 。 这 就 
需要 稍微 改变 pop() 来 载 入 next 指 针 。 如 清单 7.20 所 示 。 


清单 7.20 ”修改 pop0 来 允许 帮助 push() 


template<typename T> 
class lock free queue 
{ 
private: 
struct node 
{ 
std: :atomic<T*> data; 
std::atomic«node counter» count; 
Std::atomic«counted node ptr» next; 0 
be 
public: 
std::unique ptr<T> pop() 
{ 
counted node ptr old head-zhead.load(std::memory order relaxed); 
for(;;) 
{ 
increase external count (head,old head); 
node* const ptr=old_head.ptr; 
if (ptr==tail.load().ptr) 


{ 
} 


counted node ptr next-ptr-»next.load(); -O 
if(head.compare exchange strong(old head,next)) 


{ 


return std::unique ptr«T»(); 


T* const res-ptr-»data.exchange (nullptr); 
free external counter(old head); 
return std::unique ptr<T>(res) ; 


} 
ptr->release ref (); 
): 
如 我 所 言 ， 这 里 的 改变 是 很 简单 的 ，next 指 针 现在 是 原子 的 @， 因 此 人 @ 中 的 
lo0ad 也 是 原子 的 。 在 这 个 例子 中 ， 使 用 了 默认 的 memory_order_seq_cst 顺 序 ， 


因此 你 可 以 省 略 明 确 调用 load()， 并 且 依 靠 counted_node_ptr 的 隐 式 载 入 。 但 
是 使 用 明确 的 调用 可 以 提醒 你 稍 后 在 哪里 增加 明确 的 内 存 顺序 。 


清单 7.21 列 出 了 push() 的 更 多 代码 。 
清单 7.21 无 锁 队 列 中 使 用 帮助 的 push0 


template<typename 工 > 
class lock free queue 
{ 
private: 
void set new tail(counted node ptr &old tail, «9 
counted node ptr const &new tail) 
{ 


node* const current tail ptr=old tail.ptr; 


while(!tail.compare exchange weak {old tail,new tail) && c 
old tail.ptr-zzoeurrent tail ptr); 
if(old tail.ptr--current tail ptr) «— 
free external counter(old tail); 0 
else 
current tail ptr-»release ref(); «e 


} 
public: 

void push(T new value) 

{ 
std::unique_ptr<T> new_data(new T(new value)); 
counted node ptr new next; 
new next.ptr-new node; 
new next.external count-1; 
counted node ptr old tail-stail.load(); 


forí(;;) 


{ 


increase external count(tail,old tail); 


T* old dataznullptr; 

if(old tail.ptr-»data.compare exchange strong( 0O 
old data,new data.get())) 

{ 


counted_node_ptr old_next={0}; 

if(!old tail.ptr-»next.compare exchange strong ( 0 
old next,new next) ) 

{ 


delete new next.ptr; «e 
new next-old next; -© 
} 
set new tail(old tail, new next); 
new data.release(); 
break; 


) 


else «- 
{ 


counted node ptr old_next={0}; 
if(old tail.ptr-»next.compare exchange strong( «- 
old next,new next)) 


old_next=new_next; «—p 
new next.ptr-new node; + 
} 
set new tail(old tail, old next); «D 


这 与 清单 7.15 中 的 最 初 的 push() 是 类 似 的 ， 但 是 也 有 一 些 很 重要 的 不 同 之 
处 。 如 果 你 的 确 设置 了 data 指 针 人 @@， 就 需要 处 理 这 样 一 种 情况 。 那 就 是 另 一 个 线 
程 已 经 帮助 你 了 ， 现 在 有 一 个 else 子 句 也 在 帮助 你 四 。 


已 经 设置 了 结 点 的 data 指 针 @@，push() 的 新 版 本 使 
用 compare_exchange_strong() 来 更 新 next 指 针 @。 使 
用 compare_exchange_strong() 来 避免 循环 。 如 果 交 换 失 败 了 ， 就 可 以 得 知 另 
一 个 线程 已 经 设置 了 next 指 针 ， 因 此 就 不 再 需要 最 初 分 配 的 新 结 点 了 ， 就 可 以 删 
除 它 @。 你 仍然 想 使 用 另 一 个 线程 更 新 tail 设 置 的 next 值 ，。 


tail 指 针 的 真正 更 新 发 生 在 set_new_tail() 中 @。 这 就 使 
用 compare_exchange_weak( ) 循 环 @ 来 更 新 tail。 因 为 如 果 别 的 线程 试图 
push() 一 个 新 结 点 ， 那 么 external_count 的 值 就 发 生 了 改变 并 且 你 不 想 失 去 
它 。 尽 管 如 此 ， 你 要 注意 如 果 另 一 个 线程 已 经 成 功 改变 了 它 ， 那 么 你 就 不 能 更 换 
此 值 ; 否则 ， 就 可 能 以 在 队列 中 循环 作为 结束 ， 而 这 不 是 一 个 好 主意 。 所 以 ， 你 
要 确保 如 果 比 较 / 交 换 失 败 了 ， 载 入 值 的 ptr 是 同样 的 。 如 果 退 出 循环 时 ptr 是 同 
样 的 合 ， 那 么 你 就 必须 成 功 设置 tail， 因 此 需要 释放 旧 的 外 部 计数 @@。 如 果 退 出 
循环 时 ptr 是 不 一 样 的 ， 就 说 明 另 一 个 线程 将 释放 此 计数 占 ， 因 此 你 只 需要 通过 
该 线程 释放 单个 引用 合 。 


如 果 线 程 调用 push()， 并 且 这 次 没有 成 功 通 过 循环 设置 data 指 针 ， 那 么 它 
可 以 帮助 成 功 的 线程 完成 更 新 。 首 先 ， 你 尝试 更 新 这 个 线程 新 分 配 结 点 的 next 指 
针 @。 如 果 成 功 了 ， 你 将 使 用 你 分 配 的 结 点 作为 新 的 tail@， 并 且 需 要 分 配 男 一 
个 新 结 点 预期 可 以 真正 入 队列 @ 国 。 然 后 你 就 可 以 在 再 次 循环 前 通过 调 
用 set_new_tail 来 设置 tail@， 


你 可 能 已 经 注意 到 这 一 段 代 码 中 有 很 多 的 new 和 delete 调 用 ， 因 为 push() 分 
配 新 结 点 ， 而 pop() 销 毁 结 点 。 内 存 分 配器 的 效率 在 很 大 程度 上 影响 了 这 段 代码 
的 性 能 。 一 个 不 好 的 内 存 分 配器 可 以 完全 破坏 无 锁 容 器 的 可 扩展 性 。 选 择 和 实现 
该 分 配器 超出 了 该 书 的 范围 ， 但 是 请 记 住 判别 分 配器 是 好 是 坏 的 唯一 办 法 就 是 使 
用 它 并 且 测 试 使 用 它 前 后 代码 的 性 能 。 优 化 内 存 分 配器 的 通用 办 法 包括 在 每 个 线 


个 独立 的 内 存 分 配器 ， 以 及 使 用 空闲 表 来 回收 结 点 而 不 是 将 它们 返回 


给 分 配器 


ap 现在 ， 我 们 从 这 些 例子 里 找 出 写 无 锁 数 据 结构 的 一 些 
准 见 


7.3 ”编写 无 锁 数 据 结 构 的 准则 


如 果 你 看 了 本 章 的 所 有 例子 ， 那 么 你 就 会 了 解 使 无 锁 代 码 正确 的 复杂 性 。 如 
果 你 准备 设计 你 自己 的 数据 结构 ， 那 么 需要 注意 一 些 准 则 。 第 6 章 开 始 部 分 提 到 
的 关于 并 发 数据 结构 的 总 体 准 则 依然 是 适用 的 ， 但 是 你 需要 更 多 准则 。 我 将 从 这 
些 例子 中 提取 出 一 些 有 用 的 准则 ， 当 你 设计 你 自己 的 无 锁 数 据 结构 时 可 以 参考 。 


7.3.1 准则 : 使 用 std::memory_order_seq_cst 作 为 原型 


std: :memory_order_seq_cst 比 别 的 内 存 顺 序 更 容易 理解 ， 因 为 所 有 操作 
形成 了 总 的 顺序 。 在 这 章 的 例子 中 ， 我 们 都 是 从 std: :memory_order_seq_cst 
开始 ， 并 且 一 旦 基础 操作 正确 的 情况 下 才 会 放松 内 存 顺 序 约束 。 从 这 个 意义 上 来 
说 ， 使 用 别 的 内 存 顺 序 是 在 优化 ， 但 是 你 要 避免 过 早 优 化 。 通 常 ， 只 有 当 你 看 到 
所 有 代码 对 数据 结构 核心 操作 正确 的 时 候 ， 才 能 决定 哪些 操作 可 以 放松 。 过 早 地 
考虑 其 他 内 存 顺序 只 会 带 来 且 烦 。 代 码 可 能 会 正确 工作 ， 但 是 并 不 保证 是 这 样 
的 。 仅 仅 跑 程 序 是 不 够 的 ， 除 非 有 个 算法 检查 器 来 系统 测试 所 有 与 具体 顺序 保证 
相符 的 可 见 线程 组 合 。 


7.3.2 HEM: 使 用 无 锁 内 存 回收 模式 


无 锁 代 码 最 大 的 问题 之 一 就 是 管理 内 存 。 当 别 的 线程 仍然 引用 对 象 的 时 候 就 
不 能 删除 它们 ， 这 是 最 基本 的 。 但 是 你 仍然 想 尽 快 删除 它们 来 避免 过 多 的 内 存 消 
耗 。 本 章 将 介绍 三 种 方法 来 确保 可 以 安全 回收 内 存 。 


。 等 待 直到 没有 线程 访问 该 数据 结构 ， 并 且 删 除 所 有 等 待 删除 的 对 象 。 
。 使 用 风险 指针 来 确定 线程 正在 访问 一 个 特定 的 对 象 。 
。 引用 计数 对 象 ， 只 有 直到 没有 显著 的 引用 时 才 删 除 它 们 。 


在 所 有 的 情况 下 ， 关 键 的 想法 就 是 使 用 一 些 方法 来 记录 有 多 少 线程 在 访问 一 
个 特定 的 对 象 ， 并 且 只 删除 不 再 锐 引 用 的 对 象 。 有 很 多 方法 可 以 回收 无 锁 数据 结 
构 的 内 存 。 例 如 ， 使 用 垃圾 回收 器 是 很 理想 的 方案 。 当 你 不 再 使 用 结 点 的 时 候 ， 
垃圾 回收 期 可 以 释放 结 点 。 在 这 种 情况 下 写 程序 就 简单 一 些 。 


另 一 个 方法 就 是 回收 结 点 ， 并 且 当 数据 结构 被 销毁 的 时 候 才 完 全 释放 它们 。 


因为 结 点 是 重复 使 用 的 ， 内 存 永 远 不 会 失效 。 这 样 避免 未 定义 行为 的 困难 就 不 存 
在 了 。 缺 点 就 是 男 一 个 问题 变 得 更 常见 。 这 就 是 所 请 的 ABA 问 题 。 


7.3.3 准则: 当心 ABA 问 题 
ABA 问 题 是 任何 基于 比较 /交换 的 算法 都 必须 提防 的 问题 。 它 是 这 样 的 。 


1 线程 1 读 取 一 个 原子 变量 x， 并 且 发 现 它 的 值 为 A。 


2 线程 1 基于 这 个 值 执行 了 一 些 操作 ， 例 如 解 引用 它 〈 如 果 它 是 指针 的 话 ) 
或 者 做 一 些 查找 操作 。 


3 线程 1 被 操作 系统 阻塞 了 。 
4 惟一 个 线程 在 x 上 执行 了 一 些 操作 ， 将 它 的 值 改 为 B。 


5 第 三 个 线程 更 改 了 与 值 A 相 关 的 值 ， 因 此 线程 1 持 有 的 数值 就 不 再 有 效 
了 。 这 个 变化 有 可 能 很 大 ， 如 释放 它 所 指向 的 内 存 或 者 改变 相关 的 值 一 样 。 


6 第 三 个 线程 基于 新 值 将 x 的 值 改 回 A。 如 果 这 是 一 个 指针 ， 那 么 就 可 能 是 
一 个 新 的 对 象 ， 此 对 象 刚好 与 先前 的 对 象 使 用 了 相同 的 地 址 。 


7 线程 1 重新 取得 x， 并 在 x 上 执行 比较 /交换 操作 ， 与 A 进行 比较 。 比 较 / 交 换 
操作 成 功 了 因为 值 确实 是 A) ， 但 是 这 个 A 的 值 是 错误 的 。 第 二 步 中 读 取 的 值 不 
再 有 效 ， 但 是 线程 1 并 不 知道 ， 并 且 将 破坏 数据 机 构 。 


现在 这 里 没有 程序 遇 到 这 种 问题 ， 但 是 写 无 锁 程 序 的 时 候 就 很 容易 遇 到 这 种 
问题 。 最 利用 的 避免 这 种 问题 的 方法 就 是 在 变量 x 上 使 用 一 个 ABA 计 数 器 。 此 
时 ，x 加 上 计数 器 这 样 一 个 结合 的 数据 结构 就 将 作为 一 个 单位 ， 比 较 / 交 换 就 会 基 
于 这 个 单位 进行 操作 。 每 次 修改 值 的 时 候 ， 计 数 器 的 值 都 会 加 一 。 即 使 x 的 值 是 
一 样 的 ， 如 果 男 一 个 线程 修改 了 x， 比 较 /交换 操作 将 会 失败 。 


使 用 空闲 表 或 者 回收 结 点 而 不 是 将 它 返 回 给 分 配器 ， 使 得 ABA 问 题 在 算法 中 
是 很 常见 的 。 


7.3.4 HEM: 识别 忙于 等 竺 的 循环 以 及 辅助 其 他 线程 


在 最 后 的 队列 例子 中 ， 可 以 看 出 执行 入 队 操作 的 线程 必须 等 待 另 一 个 执行 入 
队 操作 的 线程 完成 操作 后 才能 进行 。 更 不 用 说 ， 将 会 出 现 忙 则 等 待 循环 ， 等 竺 的 
线程 不 能 继续 执行 的 时 候 会 浪 旨 CPU 时间。 如 果 最 终 以 忙 则 等 待 循 环 结束 ， 那 么 
你 事实 上 就 有 了 阻 喜 操作 ， 并 且 也 可 能 会 使 用 互 太 元 和 锁 。 通 过 修改 程序 ， 如 果 
安排 等 待 中 的 线程 运行 的 话 ， 那 么 此 线程 会 在 最 初 的 线程 完成 操作 前 继续 执行 未 
完成 的 步骤 。 此 时 就 可 以 消除 忙 则 等 待 ， 并 且 操 作 不 再 被 阻塞。 在 队列 的 例子 
中 ， 这 就 需要 将 数据 成 员 变 为 原子 变量 而 不 是 非 原 子 变量 ， 并 且 使 用 比较 /交换 操 
作 设置 它 ， 但 是 在 更 复杂 的 数据 结构 中 需要 改变 更 多 。 
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的 无 锁 数 据 结 构 的 简单 实现 。 你 必须 注意 你 的 原子 操作 的 内 存 顺序 ， 确 保 没 有 数 
据 了 范 争 并 且 每 个 线程 看 到 的 数据 结构 是 一 致 的 。 你 也 注意 到 无 锁 数 据 结构 中 的 内 
存 管理 比 基 于 锁 的 数据 结构 中 的 内 存 管理 变 得 更 难 ， 并 且 通 过 一 些 方法 来 处 理 
人 E US MM 
循环 。 


设计 无 锁 数据 结构 是 一 个 很 难 的 任务 ， 并 且 很 容易 产生 错误 ， 但 是 在 茶 些 情 
况 下 ， 这 种 数据 结构 有 很 好 的 可 扩展 性 。 和 希望 通过 本 章 的 例子 和 准则 ， 你 可 以 设 
计 你 自己 的 无 锁 数 据 结构 ， 实 现 它 或 者 发 现 别 的 人 写 的 数据 结构 中 的 错误 。 


如 果 多 个 线程 共享 数据 ， 那 么 就 需要 考虑 使 用 什么 数据 结构 以 及 如 何在 线程 
间 同 步 此 数据 。 通 过 设计 并 发 数据 结构 ， 可 以 将 它 封 装 在 数据 结构 中 ， 这 样 剩 下 
来 的 代码 就 可 以 集中 在 如 何 操作 此 数据 结构 上 而 不 是 数据 同步 上 。 在 第 8 章 中 ， 
当 我 们 从 并 发 数据 结构 转移 到 并 发 代码 上 ， 你 就 可 以 看 到 它 所 起 的 作用 了 。 并 行 
算法 使 用 多 线程 来 提高 效率 ， 当 算法 需要 多 线程 共享 数据 的 时 候 ， 选 择 使 用 何 种 
并 及 数据 结构 就 很 重要 了 。 
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第 8 章 ”设计 并 及 代码 
本 章 主要 内 容 


在 线程 间 划 分 数据 的 技术 

影响 并 发 代码 性 能 的 因素 

性 能 因素 如 何 影响 数据 结构 的 设计 
多 线程 代码 中 的 异常 安全 

可 扩展 性 

几 个 并 行 算法 实现 的 示例 


前 面 的 章节 主要 是 讨论 新 的 C++11 工 具 箱 里 用 来 写 并 行 代码 的 工具 。 在 第 6 章 
和 第 7 章 中 ， 我 们 观察 了 如 何 使 用 这 些 工具 来 设计 多 个 线程 可 以 并 发 存 取 的 安全 
的 基础 数据 结构 。 作 为 木 挨 ， 为 了 制作 柜 橱 或 者 桌子 ， 不 仅仅 需要 知道 如 何 贸 链 
或 者 接 缝 处 。 同 样 ， 需 要 设计 并 行 代码 而 不 仅仅 是 设计 和 使 用 基础 数据 结构 。 你 
需要 了 解 更 广泛 的 背景 ， 这 样 就 可 以 构造 进行 有 用 工作 的 更 大 的 结构 。 我 将 使 用 
Bi re LI 
方面 。 

正如 所 有 编程 项 目 一 样 ， 仔 细 考 虑 并 行 代 码 是 很 重要 的 。 尽 管 如 此 ， 使 用 多 
线程 代码 比 使 用 顺序 代码 需要 考虑 更 多 的 因素 。 你 不 仅 需 要 考虑 单 见 的 因 系 ， 例 
如 封装 ， 耦 合 和 内 聚 〈 在 很 多 软件 设计 书 中 有 详细 的 描述 ) ， 而 且 需 要 考虑 共享 
ar a nest Mq IIT en ue 

本 章 ， 我 们 将 致力 于 这 些 问题 ， 从 高 层次 考虑 使 用 多 少 个 线程 ， 各 个 线程 执 
行 哪些 代码 ， 以 及 这 些 是 如 何 影 响 代码 的 透明 度 。 到 低层 次 考虑 如 何 构造 共享 数 
据 来 获得 最 佳 性 能 。 


让 我 们 从 在 线程 间 划 分 工作 的 技术 开始 。 


8.1 在 线程 间 划 分 工作 的 技术 


设想 你 被 安排 建造 一 所 房子 。 为 了 完成 这 项 工作 ， 你 需要 挖 地 基 、 筑 墙 、 布 
线 等 。 理 论 上 说 ， 你 可 以 在 足够 的 训练 下 全 部 自己 完成 ， 但 是 将 耗费 很 多 时 间 ， 
并 且 会 一 直 切 换 任务 。 或 者 ， 你 可 以 雇佣 别人 来 帮助 你 。 你 只 需要 选择 雇佣 多 少 
人 并 且 决 定 他 们 需要 哪些 技能 。 例 如 ， 你 可 以 雇佣 一 些 具有 一 般 技 能 的 人 ， 并 且 
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或 者 ， 你 可 以 雇佣 一 些 专家 。 例 如 ， 砖 挨 ， 木 后 ， 电 工 和 管道 工 。 这 些 专 家 
只 做 他 们 专长 的 事情 ， 因 此 如 果 没 有 管道 工程 的 时 候 ， 管 道 工 就 不 需要 做 任何 事 
情 。 事 情 会 比 之 前 完成 得 更 快 ， 因 为 有 更 多 的 人 ， 并 且 当 电工 给 厨房 布线 的 时 
候 ， 管 道 工 可 以 安装 卫生 间 。 但 是 当 专 家 没有 工作 的 时 候 就 会 处 于 等 待 状态 。 即 
使 有 空 亲 时间， 你 也 会 发 现 雇佣 专家 比 雇佣 一 般 技 能 的 人 工作 进展 得 更 快 。 专 家 
不 需要 改变 工具 ， 并 且 他 们 完成 任务 比 一 般 人 要 快 。 无 论 这 种 情况 是 否 取决 于 特 
殊 情况 一 一 你 都 需要 尝试 一 下 。 


即使 你 雇佣 专家 ， 你 仍然 可 以 选择 每 种 专家 的 数量 。 例 如 ， 雇 佣 比 电工 数量 
更 多 的 砖 匠 就 很 合理 。 如 果 你 要 建造 不 止 一 座 房子 的 话 ， 你 的 队伍 的 构成 以 及 总 
体 效率 都 会 发 生 改变 。 即 使 管道 工 在 给 定 的 房子 上 不 会 有 太 多 的 工作 ， 你 也 可 以 
一 次 建造 很 多 房子 ， 这 样 他 就 会 始终 有 工作 了 。 并 且 ， 如 果 当 他 们 没有 工作 的 时 
0 
J 人 在 工作 。 


那么 线程 需要 做 哪些 呢 ? 同 样 的 问题 也 适用 于 线程 。 你 需要 决定 使 用 多 少 线 
程 以 及 它们 需要 完成 什么 任务 。 你 需要 决定 是 使 用 “通用 型 ”线程 来 在 需要 的 时 候 
执行 操作 ， 还 是 使 用 “专家 型 ”线程 来 做 好 一 件 事 或 一 些 合作 的 事 。 你 需要 决定 无 
论 是 为 了 使 用 并 发 性 而 划分 的 原因 ， 还 是 如 何 去 做 都 会 对 代码 的 性 能 和 清晰 度 产 
生 很 大 影响 。 因 此 理解 这 些 选 择 是 很 重要 的 ， 这 样 当 设计 你 的 应 用 中 的 数据 结构 
的 时 候 ， 就 可 以 做 出 合适 的 决定 。 在 这 部 分 ， 我 们 将 会 看 到 一 些 划分 任务 的 方 
法 。 在 我 们 做 别 的 工作 前 先 来 看 看 如 何在 线程 间 划 分 数据 。 


8.1.1 ”处理 开始 前 在 线程 间 划 分 数据 


最 早 并 行 化 的 算法 是 简单 的 算法 ， 如 std: :for_each 在 数据 集合 中 对 每 个 元 
素 进 行 操作 。 为 了 并 行 化 这 样 的 算法 ， 就 需要 将 每 个 元 系 划 分 到 一 个 处 理 线 程 
中 。 如 何 划 分 元 素来 得 到 最 优 性 能 在 很 大 程度 上 决定 于 数据 结构 的 细节 ， 稍 后 我 
们 分 析 性 能 问题 的 时 候 就 可 以 看 到 了 。 


划分 数据 最 简单 的 方法 就 是 将 第 一 个 N 元 素 分 配给 一 个 线程 ， 将 下 一 个 N 元 素 
分 配给 另 一 个 线程 ， 以 此 类 推 ， 正 如 图 8.1 所 示 ， 但 是 也 可 以 使 用 别 的 模式 。 无 论 


如 何 划分 数据 ， 每 个 线程 只 能 处 理 分 配给 它 的 元 素 ， 并 且 直 到 它 完 成 任务 的 时 候 
才能 与 别 的 线程 通信 。 
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图 8.1 在 线程 间 划 分 连续 数据 块 


这 种 结构 与 使 用 消息 传递 接口 (Message Passing Interface, MPI) [或 者 
OpenMPD 框 架 编程 的 结构 是 类 似 的 。 一 个 任务 被 分 成 一 个 并 行 任 务 集 ， 工 作 的 
线程 独立 运行 这 些 任务 ， 并 且 在 最 后 的 化 简 步 又 中 合并 这 些 结果 。 这 是 2.4 节 中 
accumulate 例 子 使 用 的 方法 ; 在 这 种 情况 下 ， 并 行 任务 和 最 后 的 步骤 都 是 累 
加 。 对 一 个 简单 的 for_each 来 说 ， 最 后 的 步 台 是 不 需要 的 ， 因 为 不 需要 化 简 结 
果 。 


确定 将 最 后 的 步 又 作为 化 简 步 又 是 很 重要 的 ， 清 单 2.8 中 的 简单 实现 将 执行 此 
化 简 作 为 最 后 的 线性 步骤 。 尽 管 如 此 ， 这 个 步骤 也 可 以 并 行 化 。 累 加 过 程 本 喘 就 
是 化 简 操 作 ， 因 此 可 以 修改 清单 2.8， 当 线程 的 数量 比 线程 处 理 的 的 最 少数 据 的 数 
量 还 要 多 ， 就 可 以 递归 地 调用 它 本 身 。 或 者 ， 当 每 个 线程 完成 它 的 任务 后 ， 工 作 
线程 可 以 执行 一 些 化 简 操 作 步 又 ， 而 不 是 每 次 产 一 些 新 线程 。 


尽管 这 种 方法 是 很 有 效 的 ， 但 是 并 不 适用 于 所 有 情况 。 有 时 数据 不 能 被 事先 
划分 ， 因 为 只 有 当 处 理 数 据 的 时 候 才 知 道 如 何 划分 。 在 化 简 算法 例如 快速 排序 
中 ， 这 种 情况 更 明显 。 因 此 需要 一 个 不 同 的 方法 。 


8.1.2 ”递归 地 划分 数据 


快速 排序 算法 有 两 个 基本 步骤 ， 基 于 其 中 一 个 元 素 〈 关 键 值 ) 将 数据 划分 为 
两 部 分 ， 一 部 分 在 关键 值 之 前 ， 一 部 分 在 关键 值 之 后 。 然 后 递归 地 排序 这 两 部 
分 。 你 无 法 通过 预先 划分 数据 来 实行 并 行 ， 因 为 只 有 当 处 理 元 素 的 时 候 才 知道 他 
们 属于 哪 一 个 “部 分 ”。 如 果 你 打算 并 行 这 个 算法 ， 就 需要 把 握 递归 的 本 质 。 每 次 


递归 的 时 候 ， 会 调用 更 多 的 quick_sort 函 数 来 排序 关键 点 之 前 和 关键 点 之 后 的 
元 素 。 这 些 递 归 调 用 是 完全 相互 独立 的 ， 因 为 它们 读 取 完全 不 同 的 元 素 集 合 。 这 
种 划分 可 以 作为 我 们 初步 的 候选 方案 。 此 递归 划分 如 图 8.2 所 示 。 
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图 8.2 ”连续 划分 数据 


在 第 4 章 中 ， 有 这 样 一 个 实现 。 不 仅 只 是 为 这 两 部 分 执行 两 个 递归 调用 ， 你 
还 在 每 一 步 都 在 前 一 部 分 使 用 std: :async() 来 生成 异步 任务 。 通 过 使 
用 std: :async()， 你 让 C++ 线程 库 来 决定 何 时 在 一 个 新 线程 上 运行 这 个 任务 ， 以 
及 何 时 同步 运行 它们 。 


当 你 对 很 大 规模 的 数据 进行 排序 的 时 候 这 是 很 重要 的 。 为 每 一 个 递归 调用 生 
成 一 个 新 线程 会 很 快 产 生 大 量 线程 。 当 我 们 考虑 性 能 的 时 候 ， 你 就 会 发 现 如 果 线 
程 太 多 的 时 候 ， 就 可 能 降低 了 应 用 。 如 果 数 据 集 很 大 的 时 候 也 可 能 会 用 完 所 有 的 
线程 。 像 这 样 用 递归 来 划分 总 体 任务 的 方法 是 很 好 的 ， 只 需要 严格 控制 线程 数量 
就 可 以 了 。 在 简单 情况 下 ，std::async( ) 就 可 以 处 理 它 ， 但 是 这 并 不 是 唯一 选择 。 


或 者 使 用 std: :thread: :hardware_concurrency() 函 数 来 选择 线程 数量 ， 
正如 清单 2.8 中 accumulate() 的 并 行 版 本 所 做 的 一 样 。 然 后 ， 你 只 是 将 此 块 存储 
到 第 6 章 和 第 7 章 描述 线程 安全 栈 中 ， 而 不 是 为 递归 调用 创建 一 个 新 线程 。 如 有 果 线 
程 不 在 工作 ， 就 说 明 它 已 经 处 理 完 所 有 块 ， 或 者 等 待 存储 在 栈 中 的 块 。 此 时 可 以 
从 栈 中 得 到 一 个 块 并 将 它 排序 。 


清单 8.1 列 出 了 使 用 这 种 方法 的 简单 实现 。 
清单 8.1 使 用 待 排序 块 栈 的 并 行 快 速 排序 


template<typename T> 


struct sorter -© 
{ 


struct chunk_to_sort 


{ 


std::list<T> data; 
std: :promise<std::list<T> > promise; 


}; 


thread_safe_stack<chunk_to_sort> chunks; -© 
std::vector<std: :thread> threads; 

unsigned const max thread count; 

std::atomic<bool> end of data; 


sorter(): 
max thread count(std::thread::hardware concurrency()-1), 
end of data(false) 


{} 


-sorter() 0 
{ 
end of datastrue; -© 


for (unsigned i=0;i<threads.size() ;++i) 


threads [i] .join(); Q0 
} 
} 
void try sort chunk() 
{ 
boost::shared ptr«chunk to sort > chunk=chunks.pop({); -© 
if (chunk) 


{ 


sort_chunk (chunk) ; «o 


) 


std::list<T> do sort(std::list«T»& chunk data) -© 


{ 


if (chunk data.empty()) 


{ 
} 


std::list<T> result; 
result.splice(result.begin(),chunk data,chunk data.begin()); 
T const& partition val-*result.begin(); 


return chunk data; 


typename std::list«T»::iterator divide points D 
std::partition(chunk data.beginí(),chunk data.end(), 
[&] (T const& val)(return val<partition_val;}); 


chunk to sort new lower chunk; 

new lower chunk.data.splice(new lower chunk.data.end(), 
chunk data,chunk data.begin(), 
divide point); 


std::future<std::list<T> > new lower- 

new lower chunk.promise.get future(); 
chunks.push(std::move(new lower chunk)); < 
if(threads.size()«max thread count) 


{ 
} 


std::list<T> new higher(do sort (chunk data)); 


threads.push back(std::thread(&sorter«T»::sort thread,this)); 


result.splice(result.end(),new higher); 

while(new lower.wait for(std::chrono::seconds(0)) !- 
std::future status::ready) 

E 


) 


result.splice(result.begin(),new lower.get()); 
return result; 


try sort chunk(); «D 


) 


void sort chunk(boost::shared ptr«chunk to sort » const& chunk) 


{ 
} 


void sort thread() 


{ 


chunk-»promise.set value(do sort(chunk-»data)); < 


while(!end of data) < 
{ 


try sort chunk(); 
std::this thread::yield(); aD 


template<typename T> 
std::list<T> parallel quick sort(std::list«T» input) + 
{ 
if (input .empty () ) 
{ 
return input; 


} 


sorter<T> s; 


return s.do_sort (input) ; <a) 


iX, parallel _ quick_sort 函 数 @ 力 代表 了 sorter 类 @ 的 大 部 分 功能 ， 提 
供 了 一 种 简单 的 方法 将 未 排序 块 @ 所 在 的 栈 进 行 分 组 ， 以 及 将 线程 集 @ 分 组 。 主 
要 的 工作 是 在 do_sort 成 员 函 数 @ 中 完成 的 ， 它 是 用 来 完成 通常 的 数据 排序 他 。 
这 次 ， 它 将 块 压 入 栈 中 国 ， 而 不 是 为 一 个 块 产生 一 个 新 的 线程 ， 并 且 当 你 仍然 有 
处 理 器 可 以 分 配 的 时 候 就 产生 一 个 新 进程 @。 因 为 后 一 部 分 可 能 是 被 男 一 个 线程 
处 理 ， 你 就 必须 等 待 它 处 理 完成 国 。 为 了 处 理 这 种 情况 《〈 即 只 有 一 个 线程 或 者 别 
的 线程 都 在 工作 ) ， 你 就 试图 在 等 竺 的 时 候 ， 让 这 个 线程 处 理 栈 中 的 块 
(D. try_sort_chunk 只 是 将 一 个 块 出 栈 @@ 并 且 将 它 排序 四， 将 结果 存储 
在 promise 中 ， 此 结果 可 以 被 将 此 块 放 入 栈 中 的 线程 取得 @。 


当 未 设置 end_of_data 标 志 的 时 候 回 ， 可 以 在 循环 中 产生 线程 将 栈 中 的 块 先 
出 栈 然 后 排序 @。 在 检查 的 时 候 ， 它 们 让 别 的 线程 先 对 栈 进 行 操作 。 这 有 段 代码 依 
靠 sorter 类 析 构 函数 @ 来 结束 这 些 线程 。 当 所 有 数据 都 被 排序 了 ， 就 会 返回 
do_sort〔 即 使 线程 仍然 在 运行 )， 因 此 主线 程 将 从 parallel _quici_sort@t 
返回 ， 并 且 销 毁 你 的 sorter 对 象 。 这 就 设置 了 end_of_ data 标志 位 四 并 且 等 待 线 
TARO. WADE SARA AD. 


使 用 这 种 方法 就 不 会 和 使 用 spawn_task 来 产生 一 个 新 线程 一 样 导致 无 穷 多 
个 线程 这 样 的 问题 了 ， 并 且 不 再 和 std: :async() 一 样 依赖 C++ 线程 库 来 选择 线程 
数量 。 现 在 我 们 将 线程 数量 限制 到 std: :thread: :hardware_concurrency() 来 
避免 过 多 的 任务 切换 。 尽 管 如 此 ， 你 有 另 一 个 潜在 的 问题 ， 处 理 这 些 线程 和 线程 
间 通 信 给 代码 增加 了 很 多 复杂 性 。 同 时 ， 尽 管 这 些 线程 在 处 理 不 相关 的 数据 元 
素 ， 它 们 都 访问 栈 来 移入 和 移出 所 操作 的 块 。 即 使 使 用 无 锁 《〈 因 此 是 无 阻塞 的 ) 
栈 ， 这 种 竞争 会 降低 性 能 。 你 稍 后 会 看 到 原因 。 


这 种 方法 是 一 种 特殊 版 本 的 线程 池 一 一 有 一 个 线程 集 ， 每 个 线程 处 理 等 待 列 
表 中 的 工作 ， 然 后 回 到 线程 池 。 线 程 池 存 在 的 问题 (包括 列表 上 的 竞争 ) ， 第 9 
PAM OOK ES AAI 本 章 稍 后 将 讨论 如 何 将 程序 扩展 到 多 处 理 器 上 执行 
(参见 8.2.1 节 ) 。 


在 处 理 开始 前 划分 数据 和 递归 划分 数据 都 是 假设 数据 是 固定 不 变 的， 然后 你 


寻找 划分 它 的 方法 ， 但 是 情况 并 不 总 是 这 样 。 如 果 数 据 是 动态 生成 的 或 者 是 外 部 
输入 的 ， 那 么 这 种 方法 就 不 行 了 。 在 这 种 情况 下 ， 通 过 任务 类 型 来 划分 工作 比 基 
于 数据 划分 更 合适 。 


8.1.3 ”以 任务 类 型 划分 工作 


通过 给 每 个 线程 分 配 不 同 数据 块 在 线程 间 划 分 工作 无论 是 事先 划分 还 是 处 
理 过 程 中 递归 划分 ) 仍然 是 基于 这 样 的 假设 ， 即 线程 将 会 基于 每 个 数据 块 做 同样 
的 工作 。 划 分 工作 的 男 一 种 方法 是 使 得 线程 变 得 专业 化 ， 即 每 个 线程 执行 不 同 的 
任务 ， 就 如 同 建造 房子 的 时 候 管 道 工 和 电工 执行 不 同 的 任务 一 样 。 线 程 可 以 基于 
e 


这 种 划分 工作 的 方式 源 目 于 将 并 发 中 的 关注 点 分 离 。 每 个 线程 都 有 不 同 的 任 
务 ， 并 且 独 立 于 别 的 线程 来 工作 。 偶 尔 别 的 线程 可 能 给 它 数据 或 者 有 触发 事件 需 
要 处 理 ， 但 是 通常 每 个 线程 只 做 一 件 事情 。 这 本 质 上 是 一 个 好 设计 ， 每 块 任务 者 
应 该 只 负责 一 个 单一 的 任务 。 


1， 以 任务 类 型 划分 工作 来 分 离 关 注 点 


当 在 一 段 时 间 内 需要 持续 运行 多 个 任务 的 时 候 ， 或 者 需要 此 应 用 能 够 及 时 处 
理 有 输入 的 事件 (例如 用 户 键 盘 输 入 或 者 输入 网 络 数据 〉 而 不 影响 别 的 线程 继续 
执行 的 时 候 ， 单 线程 应 用 需要 处 理 与 单一 任务 原则 间 的 矛盾 。 在 单线 程 环 境 中 ， 
你 手工 写 代 码 来 执行 任务 A 的 一 部 分 ， 执 行 任 务 B 的 一 部 分 ， 检 碍 键盘 输入 ， 检 查 
输入 的 网 络 包 ， 然 后 继续 循环 执行 A 的 力 一 部 分 。 这 束 意 味 着 任务 A 代码 的 结束 部 
分 会 变 复杂 ， 因 为 需要 保留 它 的 状态 以 及 周期 性 地 返回 控制 给 主 循环 。 如 果 你 给 
循环 增加 了 太 多 任务 ， 运 行 就 会 变 得 很 慢 ， 并 且 使 用 者 会 发 现 键盘 输入 的 啊 应 时 
间 太 长 。 你 肯定 见 过 一 些 应 用 采取 过 极端 的 方式 。 你 设置 它 处 理 一 些 任务 ， 然 后 
接口 保持 不 变 直 到 它 完成 任务 。 


这 就 是 线程 发 生 作用 的 地 方 。 如 果 你 在 独立 的 线程 里 运行 每 个 任务 ， 操 作 系 
统 就 可 以 帮 你 处 理 这 种 问题 。 在 任务 A 的 代码 中 ， 你 可 以 致力 于 执行 任务 ， 并 且 
不 需要 担心 保留 状态 以 及 返回 到 主 循环 或 者 在 此 之 前 你 花费 了 多 长 时 间 。 操 作 系 
统 将 自动 地 保留 状态 ， 然 后 在 适当 的 时 候 切 换 到 任务 B 或 C， 并 且 如 果 系 统 有 多 个 
核 或 者 处 理 器 ， 任 务 A 和 B 就 可 以 真正 地 并 行 运行 。 处 理 键盘 输入 或 者 网 络 包 的 代 
码 将 会 运行 得 很 及 时 ， 并 且 缘 大 欢喜 。 使 用 者 获得 及 时 啊 应 ， 你 作为 开发 者 可 以 
写 更 简单 的 代码 ， 因 为 每 个 线程 都 致力 于 做 与 任务 直接 相关 的 操作 ， 而 不 是 与 控 
制 流 和 用 户 互 动 混合 在 一 起 。 


看 上 去 这 是 一 个 很 好 的 版 本 。 它 真 的 如 此 吗 ?如 同 任何 事情 一 样 ， 它 取决 于 
细节 。 如 果 每 件 事情 都 是 独立 的 ， 并 且 线程 不 需要 与 另 一 个 线程 通信 ， 那 么 它 就 
确实 很 简单 了 。 可 是 ， 事 实 却 并 不 是 如 此 。 这 些 后 台 任务 经 常 做 一 些 用 户 需要 的 
事情 ， 并 且 它们 需要 更 新 用 户 接口 让 用 户 知道 是 何 时 完成 这 些 任务 的 。 或 者 ， 用 


户 可 能 要 取消 任务 ， 这 就 会 要 求 用 户 接口 以 某 种 方式 给 后 台 任 务 发 送 一 个 消息 通 
知 它 停止 此 任务 。 这 两 种 情况 都 需要 仔细 的 思考 ， 设 计 以 及 适当 的 同步 。 但 是 这 
些 关 注 点 都 是 分 离 的。 用 户 接口 线程 仍然 只 是 处 理 用 户 接口 ， 但 是 当 别 的 线程 要 
求 时 ， 它 需要 更 新 它 的 接口 。 同 样 ， 运 行 后 台 任 务 的 线程 仍然 致力 于 那个 任务 要 
求 的 操作 ， 只 有 妆 它 的 操作 是 “允许 为 一 个 线程 停止 此 任务 ”。 在 这 两 个 例子 中 ， 

线程 都 不 关心 该 要 求 是 从 哪里 产生 的 ， 只 关心 它 是 否 是 为 它们 准备 的 以 及 与 它们 
的 任务 是 否 直 接 相关 。 


多 个 线程 关键 点 分 离 有 两 个 危害 。 首 先 就 是 你 将 分 离 错 误 的 关键 点 。 征 兆 就 
是 线程 间 有 很 多 共享 数据 ， 或 者 不 同 的 线程 都 以 等 竺 彼此 作为 结束 。 这 两 种 情况 
都 可 以 归结 为 线程 间 有 太 多 的 通信 。 如 果 发 生 这 种 情况 ， 就 值得 查找 产生 通信 和 原 
因 。 如 果 所 有 的 通信 都 与 同一 件 事 相关 ， 那 么 可 能 那 就 是 单线 程 的 关键 任务 ， 并 
且 从 所 有 引用 它 的 线程 中 获得 。 或 者 ， 如 果 两 个 线程 彼此 之 间 需 要 很 多 通信 但 是 
与 别 的 线程 通信 很 少 ， 那 么 它们 就 应 该 联合 为 一 个 线程 。 


当 根 据 任 务 类 型 在 线程 间 划 分 工作 的 时 候 ， 你 就 不 需要 局 限于 完全 独立 的 任 
务 。 如 果 多 个 数据 集合 需要 应 用 同样 的 操作 序列 ， 那 么 融 可 以 划分 工作 使 每 个 线 
程 执行 整个 序列 中 一 个 步骤 。 


2. 划分 线程 间 的 任务 序列 


如 果 你 的 任务 是 由 在 很 多 独立 数据 项 上 运行 同样 的 操作 序列 组 成 的 话 ， 就 可 
以 使 用 管道 来 开发 系统 可 能 的 并 发 性 。 可 以 将 它 类 比 为 管道 ， 数 据 通过 一 系列 操 
作 管 子 ) 从 一 端 流 入 ， 并 且 从 男 一 端 流出 。 


为 了 用 这 种 方式 划分 工作 ， 你 在 管道 的 每 一 个 步 又 都 创造 一 个 独立 的 线程 
一 一 序列 中 的 每 个 操作 都 有 一 个 线程 。 当 操作 完成 时 ， 数 据 元 素 被 放 入 队列 中 供 
下 一 个 线程 获得 。 这 就 允许 当 管道 中 第 二 个 线程 在 操作 第 一 个 元 素 的 时 候 ， 第 一 
个 线程 执行 序列 中 的 第 一 个 操作 来 开始 下 一 个 数据 元 素 。 


这 是 仪 仅 在 线程 间 划 分 数据 的 一 种 蔡 代 方法 ， 正 如 8.1.1 节 中 描述 的 一 样 ， 并 
且 在 操作 开始 时 并 不 知道 所 有 输入 数据 的 情况 下 是 适用 的 。 例 如 ， 数 据 可 能 是 通 
人 


当 序 列 中 的 每 个 操作 都 消耗 时 间 的 时 候 ， 管 道 也 可 以 很 好 地 工作 。 通 过 在 线 
程 间 划分 任务 而 不 是 数据 ， 你 改变 了 性 能 概况 。 假 设 你 要 在 四 核 上 处 理 20 个 数据 
项 ， 并 且 每 个 数据 项 需要 四 个 步骤 ， 每 个 步骤 需要 3 秒 。 如 果 你 在 四 个 线程 中 划 
分 数据 ， 那 么 每 个 线程 要 处 理 5 个 数据 项 。 假 设 没有 别 的 影响 时 间 的 处 理 ，12 秒 
后 将 处 理 完 4 个 数据 项 ，24 秒 后 将 处 理 完 8 个 数据 项 ， 以 此 类 推 。1 分 钟 后 将 处 理 
完 所 有 的 20 个 数据 项 。 如 果 使 用 管道 ， 事 情 就 会 不 一 样 了 。 可 以 将 四 个 步骤 中 的 
每 个 步骤 分 配 到 一 个 处 理 核 上 。 现 在 每 个 核心 都 要 处 理 第 一 个 元 系 ， 因 此 需要 12 
秒 。 实 际 上 ，12 秒 后 你 只 处 理 完 一 个 数据 项 ， 这 就 没有 比 数据 划分 的 方法 好 。 但 
是 ， 一 旦 管道 被 使 用 ， 处 理事 情 就 会 变 得 不 一 样 了 。 在 第 一 个 核心 处 理 完 的 第 一 


项 以 后 ， 它 接着 处 理 第 二 项 。 因 此 一 旦 最 后 一 个 核 处 理 完 第 一 项 ， 它 就 可 以 在 第 
二 项 上 执行 它 的 步 又。 现在 每 3 秒 都 可 以 处 理 完 一 个 数据 项 ， 而 不 是 在 每 12 秒 能 
处 理 完 一 批 四 个 数据 项 。 


处 理 整 个 分 批 会 花费 更 长 的 时 间 ， 因 为 在 最 后 一 个 核 开 始 处 理 第 一 个 数据 项 
之 前 你 需要 等 待 9 秒 。 但 是 更 平滑 ， 更 有 规律 的 处 理 在 茶 些 环境 下 可 能 会 很 有 
效 。 例 如 ， 考 虑 用 来 收看 高 清 数字 电视 的 系统 。 为 了 使 电视 是 可 看 的 ， 你 至 少 需 
要 每 秒 25 帧 并 且 更 多 的 帧 得 到 更 理想 的 效果 。 同 样 ， 观 看 者 需要 它们 被 均匀 地 分 
开 来 得 到 持续 活动 的 印象 ， 一 个 可 以 每 秒 解 码 100 帧 的 应 用 是 没 用 的 ， 如 果 它 暂 
停 一 秒 ， 然 后 显示 100 帧 ， 然 后 再 停 一 秒 ， 然 后 显示 男 一 个 100 帧 ， 男 一 方面 ， 观 
看 者 可 能 很 高 兴 接 受 当 他 们 开始 观看 电视 的 时 候 有 几 秒 的 延迟 。 在 这 种 情况 下 ， 
使 用 管道 以 一 个 更 好 、 更 稳定 的 速度 并 行 输出 帧 可 能 会 更 好 。 


己 经 看 过 在 线程 间 划 分 工作 的 一 些 方法 ， 我 们 来 看 看 影响 多 线程 系统 性 能 的 
因素 以 及 它 是 如 何 影响 你 选择 的 方法 的 。 


8.2 ”影响 并 及 代码 性 能 的 因 系 


如 果 要 用 并 发 来 提高 程序 在 多 处 理 器 环境 下 的 性 能 ， 我 们 需要 了 解 哪 些 因素 
会 影响 。 哪 怕 你 只 是 用 多 线程 来 进行 关注 点 分 离 ， 你 需要 确保 这 不 会 对 性 能 有 负 
面 影响 。 如 果 你 的 程序 在 16 核 的 机 器 上 跑 得 比 在 一 台 老 的 单 核 机 器 上 还 更 慢 ， 客 
户 可 是 不 会 买账 的 。 


接 下 来 ， 我 们 会 看 到 有 非常 多 的 因素 影响 多 线程 程序 的 性 能 一 一 哪 介 只 是 改 
变 下 每 个 线程 处 理 的 哪 部 分 数据 (其 他 都 保持 不 变 ) 都 会 对 性 能 有 巨大 的 影 啊 。 
DO HA URN QUIS 些 明显 的 因素 看 起 ， 如 你 的 目标 机 器 有 多 少 个 
理 器 ? 


8.2.1 4 7b b TER? 


处 理 器 的 数量 和 结构 是 多 线程 程序 的 性 能 的 首要 和 关键 的 因素 。 有 时 你 在 开 
发 时 是 知道 目标 硬件 ， 有 目标 硬件 的 规格 甚至 在 一 样 的 硬件 上 开发 。 有 这 种 条 件 
你 算得 上 是 注 运 儿 了， 但 是 一 般 情 况 我 们 没 这 种 待遇 。 也 许 你 是 在 相似 的 硬件 环 
境 下 开发 ， 但 是 其 中 的 差异 会 很 致命 。 例 如 ， 你 在 2 核 或 4 核 的 系统 下 开发 ， 而 你 
的 客户 可 能 有 和 多核 处 理 咒 或 者 多 个 单 核 处 理 器 ， 乃 至 多 个 多 核 处 理 嚣 。 并 发 程序 
的 行为 和 性 能 在 这 样 不 同 的 环境 下 会 有 很 大 的 差异 。 因 此 你 需要 和 仔细 考量 会 有 哪 
些 影响 并 尺 可 能 地 进行 测试 。 


简单 近似 的 话 ， 一 个 16 核 处 理 器 等 价 于 4 个 4 核 处 理 器 或 16 个 单 核 处 理 器 ， 因 
为 它们 都 可 以 并 发 执行 16 个 线程 。 你 的 程序 至 少 要 有 16 个 线程 来 利用 好 这 些 硬 
件 。 如 果 少 于 16， 束 会 有 处 理 器 性 能 闲置 (除非 这 个 机 器 还 在 运行 其 他 程序 ， 我 
们 现在 忽略 这 个 情形 〉; 男 一 方面 ， 如 果 你 有 多 于 16 个 线程 要 运行 (没有 阻塞 或 
等 待 ) ， 会 浪费 处 理 器 的 运算 力 在 切换 这 些 线程 上 《参见 第 1 章 ) 。 这 种 情况 一 
般 被 称 为 过 度 订 阅 Coversubscription) 。 


为 了 让 程序 中 的 线程 数量 随 着 硬件 能 同时 运行 的 线程 数量 扩展 ，C++11 的 标 
准 库 提供 了 std: :thread: :hardware_concurrency() 。 我 们 已 经 看 过 使 用 它 的 
例子 。 


直接 调用 std: :thread: :hardware_concurrency() 时 需要 注意 ， 你 的 程序 
并 没有 考虑 机 器 上 运行 的 其 他 线程 ， 除 非 你 显 式 地 共享 这 些 信 息 。 最 坏 的 情况 
是 ， 多 个 线程 同时 调用 std: :thread: :hardware_concurrency() 会 造成 严重 的 
过 度 订 阅 。 而 std: :async() 会 在 被 调用 时 ， 由 标准 库 处 理 所 有 这 些 调 用 并 适当 
地 调度 ， 从 而 避免 这 个 问题 。 精 心 设计 的 线程 池 也 能 避免 这 个 问题 。 


即使 你 已 经 考虑 了 程序 中 所 有 运行 的 线程 ， 你 仍然 会 被 其 他 同时 运行 的 程序 
影响 。 尽 管 在 单 用 户 环境 下 很 少 有 多 个 CPU 密集 型 任务 同时 运行 ， 在 某 些 场景 下 


这 种 情况 会 更 普遍 。 为 这 种 应 用 场景 设计 的 系统 一 般 会 提供 某 种 机 制 来 让 程序 选 

择 合适 的 线程 数 ， 当 然 这 已 经 不 在 C++ 标准 内 了 。 一 种 方法 是 提供 类 

似 std: :async() 的 调用 ， 在 选择 线程 数量 时 考量 所 有 程序 异步 执行 的 任务 数 
量 。 另 一 种 是 限制 给 定 程 序 使 用 的 核 的 数量 。 我 希望 在 这 样 的 平台 上 可 以 

用 std: :thread: :hardware_concurrency() 来 返回 这 个 数量 ， 不 过 这 取决 于 具 

A E AE 
方案 。 


这 种 情况 下 随 之 而 来 的 麻烦 是 : 一 个 问题 的 理想 算法 取决 于 问题 大 小 和 处 理 
单元 的 数量 。 如 果 你 在 有 大 量 处 理 单元 的 大 规模 并 行 处 理 机 上 运行 ， 耗 费 操 作 多 
的 算法 可 能 会 比 操作 少 的 算法 快 得 多 ， 因 为 每 个 处 理 器 只 需要 处 理 少量 的 操作 。 


随 着 处 理 器 数量 增加 ， 男 一 个 影响 性 能 的 问题 也 出 现 了 ， 多 个 处 理 器 访问 相 
同 的 数据 。 


8.2.2 ”数据 竞争 和 乒乓 缓存 


如 果 两 个 线程 同时 在 不 同 的 处 理 器 上 运行 ， 它 们 同时 读 取 同样 的 数据 通常 不 
会 有 问题 ， 数 据 会 被 复制 到 各 目的 缓存 ， 两 个 处 理 器 都 可 以 继续 执行 。 但 是 ， 如 
果 其 中 一 个 线程 修改 了 数据 ， 这 个 修改 雷 要 花费 时 间 传 播 到 男 一 个 处 理 器 的 绥 
存 。 取 决 于 两 个 线程 的 操作 和 这 些 操 作 的 内 存 顺 序 ， 这 样 的 修改 可 能 导致 第 二 个 
处 理 器 停 下 来 等 竺 内存 硬件 传播 对 数据 的 修改 。 从 CPU 指令 来 说 ， 这 是 个 相当 于 
数 百 条 指令 的 显著 缓慢 的 操作 ， 有 具体 的 时 间 主 要 与 硬件 的 物理 结构 相关 。 


考虑 下 面 这 段 简单 代码 。 


std: :atomic<unsigned long» counter(0); 
void processing loop() 
{ 
while (counter.fetch_add(1,std::memory order relaxed) <100000000) 
{ 
do something(); 


} 


这 里 的 counter 是 全 局 的 ， 每 个 调用 processing_loop() 的 线程 都 在 修改 同 
一 个 变量 。 因 此 ， 每 次 在 增加 时 ， 处 理 器 必须 保证 它 的 缓存 中 有 counter 的 最 新 
拷贝 、 人 和 修改， 然后 发 布 到 其 他 处 理 器 。 即 使 你 用 std: :memory_order_relaxed 
来 让 编译 器 不 同步 其 他 数据 ，fetch_add 是 一 个 * 读 -修改 - 写 ” 操 作 ， 因 此 需要 获 
取 变 量 最 新 的 值 。 如 果 其 他 处 理 器 上 的 其 他 线程 在 运行 同样 的 代码 ，counter 的 
数据 就 必须 在 两 个 处 理 器 之 间 来 回 传递 来 保证 每 个 处 理 器 在 增加 时 都 有 最 新 的 
counter 值 。 如 果 do_something() 耗 时 很 少 ， 或 者 有 太 多 的 处 理 器 在 运行 这 上 段 
代码 ， 处 理 器 可 能 会 处 于 互相 等 待 的 状态 。 一 个 处 理 器 已 经 准备 好 更 新 这 个 值 ， 
但 是 另 一 个 处 理 器 已 经 在 做 了 ， 这 就 要 等 待 另 一 个 处 理 器 更 新 ， 并 且 这 个 改动 已 


经 传播 完成 ， 这 种 情况 被 称 为 高 竞争 Chighcontention) 。 如 果 处 理 器 很 少 需要 
互相 等 待 ， 则 称 为 低 竞 争 (lowcontention)。 


在 这 样 的 循环 中 ，counter 的 数据 在 各 处 理 器 的 绥 存 间 来 回 传递 。 这 被 称 为 
乒乓 缓存 〈cacheping-pong) ， 而 且 会 严重 影响 程序 的 性 能 。 如 果 处 理 器 因为 需 
要 等 待 缓存 而 被 挂 起 ， 在 这 个 时 间 里 处 理 器 无 法 进行 任何 工作 ， 即 使 有 其 他 线程 
等 待 被 执行 ， 这 对 整个 程序 来 说 不 是 个 好 消息 。 


也 许 你 会 觉得 这 不 会 在 自己 喘 上 发 生 ， 因 为 不 会 号 这 样 的 循环 。 但 是 你 能 确 
定 吗 ? 如 互 斥 锁 ， 如 果 众 在 一 个 各 未 中 获得 一 外 信友 元 ， 你 的 代码 从 妆 据 访问 的 
角度 看 和 上 面 的 代码 会 非常 相像 。 为 了 锁 住 互 斥 元 ， 另 一 个 线程 必须 从 它 所 在 的 
处 理 器 获得 互 斥 元 并 修改 。 当 操作 完成 后 ， 它 叉 修 改 互 斥 元 来 释放 ， 相 关 的 数据 

必须 传递 到 下 一 个 需要 互 斥 元 的 线程 所 在 的 处 理 器 。 这 个 传递 所 需 的 时 间 是 第 二 
个 线程 等 待 第 一 个 线程 释放 殷 斥 元 的 额外 时 间 。 


std: :mutex m; 
my_data data; 
void processing loop with mutex 1) 


{ 
while (true) 
{ 
std::lock guard«std::mutex» lkím); 
if(done processing(data)) break; 
j 
j 


PLE re BORE AB od: 如 果 数 据 和 互 斥 元 被 不 止 一 个 线程 访问 ， 当 你 添加 更 
多 的 核 和 处 理 器 时 ， 你 就 越 可 能 面临 高 部 争 ， 处 理 器 需要 等 竺 另 一 个 处 理 器 。 如 
琳 你 更 快 地 用 多 线程 来 处 理 同样 的 数据 ， 这 些 线程 会 竞争 这 些 数据 ， 并 竞争 同一 
个 互 斥 元。 线程 数量 越 多 ， 就 越 可 能 同时 试图 获取 互 斥 元 或 者 访问 茶 个 原子 变 


里 。 


范 争 互 斥 元 的 影响 通常 和 竞争 原子 操作 不 同 ， 因 为 使 用 互 斥 元 在 操作 系统 层 
面 将 线程 串 行 化 ， 而 不 是 在 处 理 器 层面 。 如 果 你 有 足够 的 线程 等 待 运行 ， 操 作 系 
统 会 在 一 个 线程 等 待 互 太 元 时 调度 另 一 个 线程 运行 。 与 之 相对 的 是 ， 处 理 器 的 挂 
起 会 阻止 其 他 线程 在 这 个 处 理 器 上 运行 。 但 是 ， 这 仍然 会 影响 其 他 竞争 这 个 互 斥 
元 的 线程 的 性 能 ， 因 为 它们 每 次 只 有 一 个 会 被 运行 。 


在 第 3 章 ， 我 们 看 过 如 何 用 一 个 单 写 入 者 ， 多 读 取 者 的 互 斥 元 保护 很 少 更 新 
的 数据 结构 的 例子 (参见 3.3.2 节 ) 。 兵 乓 缓存 会 使 得 只 用 一 个 互 斥 元 的 好 处 不 明 
显 ， 特 别 是 工作 量 大 的 时 候 。 因 为 所 有 访问 数据 的 线程 〈 甚 至 是 读 取 者 仍然 需要 
自己 去 修改 互 斥 元 。 随 着 访问 数据 的 处 理 器 数量 上 升 ， 互 斥 元 本 身 的 竞争 也 在 增 


加 ， 包 含 互 斥 元 的 缓存 线 必 须 在 各 个 核 之 间 传 递 ， 导 致 获取 和 释放 锁 的 时 间 不 可 
接受 。 你 可 以 用 一 些 方法 来 改善 ， 主 要 是 通过 将 互 斥 元 分 布 在 多 个 缓存 线 ， 但 这 
就 意味 着 你 要 上 自己 去 实现 这 样 的 互 斥 元 ， 而 不 能 使 用 系统 本 吴 提 供 的 。 


如 果 乒 乓 缓存 效应 有 害 ， 我 们 如 何 避 免 呢 ? 本 章 稍 后 会 揭示 ， 解 决 方法 依赖 
于 提高 并 发 度 ， 尽 可 能 地 避免 两 个 线程 竞争 从 一 个 内 存 位 置 。 不 过 这 并 不 容易 做 
到 ， 即 使 一 个 特定 内 存 区 域 只 有 一 个 线程 会 去 访问 ， 你 仍然 会 遇 到 乒乓 缓存 ， 
为 存在 假 共享 (falsesharing) 的 问题 。 


8.2.3” 假 共享 


处 理 器 缓存 的 最 小 单位 通常 不 是 一 个 内 存 地 址 ， 而 是 一 小 块 称 为 缓存 线 
(cacheline) 的 内 存 。 这 些 内 存 块 一 般 大 小 为 32 一 64 字 节 ， 取 诀 于 具体 的 处 理 
器 。 绥 存 只 能 处 理 缓存 线 大 小 的 内 存 块 ， 相 邻 地 址 的 数据 会 被 载 入 同一 个 缓存 
线 。 有 时 这 是 好 事 ， 线 程 访问 的 数据 在 同一 个 缓存 线 比 分 布 在 多 个 缓存 线 更 好 。 
但 是 如 果 缓 存 线 内 有 个 相关 但 需要 个别 的 线程 访 间 的 数据 ， 会 导致 严 量 的 性 能 问 


题 


假设 你 有 一 个 int 型 的 数组 以 及 一 组 线程 ， 每 个 线程 都 不 停 访 问 和 改写 数组 
中 彼此 正 交 的 部 分 。 因 为 整 型 的 大 小 通常 小 于 绥 存 线 ， 数 组 中 的 多 个 元 素 会 出 现 
在 同一 个 缓存 线 。 这 样 即 使 线程 只 访问 自己 相关 的 数据 ， 仍 然 会 有 乒乓 缓存 。 一 
个 线程 在 更 改 其 访问 的 数据 时 ， 绥 存 线 的 所 有 权 需 要 转移 到 其 所 在 的 处 理 器 ， 而 
另 一 个 线程 所 需 的 数据 可 能 也 在 这 个 缓存 线 上 ， 当 它 访 问 时 缓存 线 又 要 再 次 转 
移 。 这 个 缓存 线 是 两 者 共享 的 ， 然 而 其 中 的 数据 并 不 共享 ， 因 此 被 称 为 假 共 享 
(falsesharing) 。 这 里 的 解决 方案 是 构造 好 数据 的 结构 ， 使 得 被 同一 个 线程 访问 
的 数据 在 内 存 中 也 是 相 邻 的 ， 这 样 就 更 可 能 出 现在 同一 个 缓存 线 ， 而 不 同 线程 访 
问 的 数据 则 分 散在 内 存 中 ， 使 之 更 可 能 地 出 现在 不 同 的 缓存 线 。 本 章 稍 后 会 介绍 
如 何 根据 这 个 要 求 设计 数据 和 代码 。 


如 果 说 多 个 线程 访问 同一 个 缓存 线 有 害 ， 那 么 单个 线程 访问 的 数据 的 内 存 布 
局 义 有 什么 影响 呢 ? 


8.2.4 BIAS X 


假 共 享 是 由 于 一 个 线程 访问 的 数据 与 另 一 个 线程 的 靠 得 太 近 ， 而 另 一 个 与 数 
据 布局 直接 相关 的 性 能 隐患 则 来 自 一 个 线程 本 身 。 根 源 是 数据 的 相 邻 度 。 如 果 线 
程 访问 的 数据 分 散在 内 存 中 ， 意 味 着 这 些 数据 分 布 在 各 个 缓存 线 上 。 因 此 ， 更 多 
eee ee erie cg 
分 布 紧密 的 情况 。 


同时 ， 这 也 会 增加 线程 需要 的 茶 个 缓存 线 同 时 含有 其 他 线程 访问 的 数据 的 可 
能 性 。 极 端 情况 下 ， 绥 存 中 无 关 的 数据 会 多 于 你 关心 的 数据 。 这 会 浪费 宝贵 的 组 


存 空间 ， 迫 使 处 理 器 将 需要 的 数据 移出 缓存 来 腾 出 空间 ， 这 样 更 容易 缓存 未 命中 
而 不 得 不 从 内 存 中 获取 数据 。 


这 对 单线 程 代码 的 性 能 很 重要 ， 而 我 们 在 这 里 考虑 它 的 原因 是 任务 切换 
(taskswitching) 。 如 果 有 多 余 CPU 核 数 量 的 线程 ， 每 个 核 都 将 运行 多 个 线程 。 
这 会 增加 缓存 的 压力 ， 因 为 你 要 保证 不 同 线程 访问 不 同 的 缓存 线 以 避免 假 共享 。 
因此 ， 当 处 理 器 切换 线程 时 ， 数 据 分 散在 多 个 缓存 线 比 每 个 线程 的 数据 都 紧 靠 在 
同一 个 缓存 线 ， 更 可 能 需要 重 载 这 些 缓存 线 。 


如 果 线 程 数 多 于 核 或 者 处 理 器 处 理 ， 操 作 系统 可 能 也 会 选择 在 一 个 核 上 给 某 
个 线程 分 配 一 个 时 间 片 ， 之 后 又 到 另 一 个 核 上 给 这 个 线程 分 配 时 间 片 。 这 就 需要 
将 这 个 线程 所 需 的 缓存 线 从 第 一 个 核 转 移 到 第 二 个 核 。 需 要 转移 的 缓存 线 越 多 ， 
消耗 的 时 间 也 越 多 。 尺 管 操作 系统 通常 会 尽 可 能 避免 这 种 情况 ， 这 种 现象 仍然 存 
在 并 且 一 旦 发 生 就 会 严重 影响 性 能 。 


任务 切换 导致 的 问题 在 大 量 线程 处 于 就 绪 而 不 是 等 待 状态 时 特别 突出 。 这 是 
我 们 已 经 接触 过 的 问题 : 过 度 订 阅 。 


8.2.5 过度 订阅 和 过 多 的 任务 切换 


在 多 线程 的 系统 中 ， 线 程 数量 通 第 会 多 于 处 理 器 数量 ， 除 非 你 使 用 的 是 大 规 
模 并 行 处 理 机 。 然 而 ， 线 程 经 党 花 时 间 等 待 外 部 MO 操作 完成 或 者 因为 互 斥 元 而 阻 
塞 ， 又 或 者 在 等 待 一 个 条 件 变量 等 ， 因 此 数量 多 于 处 理 器 并 不 会 带 来 问题 。 多 出 
的 线程 可 以 让 程序 进行 有 用 的 工作 而 不 是 使 处 理 器 空闲 等 待 。 


但 是 这 不 总 是 好 事 。 当 你 有 太 多 的 线程 时 ， 你 会 有 多 余 可 用 处 理 器 的 就 绪 线 
程 ， 操 作 系统 将 会 开始 频繁 的 任务 切换 以 保证 所 有 线程 享有 适当 的 时 间 片 。 我 们 
在 第 1 章 看 到 过 ， 这 会 增加 任务 切换 的 额外 开销 ， 并 且 由 于 数据 没有 相 邻 导致 的 
一 系列 缓存 问题 。 过 度 订阅 会 在 以 下 情况 产生 : 你 有 任务 无 限制 地 生成 新 的 线 
程 ， 如 第 4 章 递 归 调 用 的 快速 排序 ， 或 者 你 根据 任务 类 型 分 配 的 线程 数量 大 于 处 
理 圳 的 数量 ， 而 任务 更 依赖 于 CPU 而 不 是 IO。 


如 果 你 只 是 因为 划分 数据 产生 了 太 多 的 线程 ， 你 可 以 简单 的 限制 工作 线程 的 
数量 ， 就 像 我 们 在 8.1.2 节 见 过 的 一 样 。 如 果 过 度 订阅 来 自 于 对 任务 类 型 的 划分 ， 
你 就 没有 什么 改进 的 余地 了 ， 这 时 选择 合适 的 划分 也 许 超出 了 你 对 目标 平台 的 知 
人 


其 他 因素 也 能 影响 多 线程 代码 的 性 能 。 乒 乓 缓存 的 代价 在 两 个 单 核 处 理 器 和 
一 个 双核 处 理 器 上 会 有 很 大 的 差异 ， 哪 人 两 个 平台 的 CPU 类 型 和 时 钟 频率 都 一 
样 。 以 上 都 是 重要 的 因素 ， 对 性 能 有 显著 的 影响 。 现 在 ， 让 我 们 了 解 一 下 这 会 如 
何 影响 我 们 代码 和 数据 结构 的 设计 。 
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在 8.1 节 中 我 们 看 到 了 在 线程 间 划 分 工作 的 一 些 方法 ， 在 8.2 节 中 我 们 看 到 了 
影响 代码 性 能 的 一 些 因 素 。 当 设计 多 线程 性 能 的 数据 结构 的 时 候 如 何 使 用 这 些 信 
BU? 这 是 在 第 6 章 和 第 7 章 中 处 理 的 很 困难 的 问题 ， 是 关于 设计 可 以 安全 并 行 读 
取 的 数据 结构 。 正 如 你 在 8.2 节 中 看 到 的 一 样 ， 即 使 没有 别 的 线程 共 译 此 数据 ， 单 
个 线程 使 用 的 数据 布局 也 会 对 它 产生 影响 。 


当 为 多 线程 性 能 设计 你 的 数据 结构 时 需要 考虑 的 关键 问题 是 竞争 、 假 共享 以 
及 数据 接近 。 这 三 个 方面 都 会 对 性 能 产生 很 大 影响 ， 并 且 通 常 你 可 以 通过 改变 数 
据 布 局 或 者 改变 分 配给 某 线 程 的 数据 元 素来 提高 性 能 。 首 先 ， 我 们 来 看 一 个 简单 
的 例子 ， 在 线程 间 划 分 数组 元 素 。 


8.3.1 ”为 复杂 操作 划分 数组 元 素 


假设 你 正在 做 一 些 复杂 的 数学 计算 ， 你 需要 将 两 个 大 窍 阵 想 乘 。 为 了 实现 矩 
阵 相 乘 ， 你 将 第 一 个 矩阵 的 第 一 行 每 个 元 素 与 第 二 个 和 矩阵 的 第 一 列 相 对 应 的 每 个 
元 素 相 弱 ， 并 将 结果 相 加 得 到 结果 和 矩阵 左上 角 第 一 个 元 素 。 然 后 你 继续 将 第 二 行 
与 第 一 列 相 乘 得 到 结果 矩阵 第 一 列 的 第 二 个 元 素 ， 以 此 类 推 。 正 如 图 8.3 所 示 ， 突 
出 显示 的 部 分 表明 了 第 一 个 矩阵 的 第 二 行 与 第 二 个 矩阵 的 第 三 列 配对 ， 得 到 结果 
和 矩阵 的 第 三 列 第 二 行 的 值 。 


fà; 821831841 = 


813823833843 = 


C1,1 C21 C3,1 C441 ++ 


C12 c2 [E] c4.2 5X; 


C1,3 C23 C33 C43 +++ 


81,m82,m83,m84,m … C1,m C2,m C3,m Ca m … 
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为 了 值得 使 用 多 线程 来 优化 该 乘法 运算 ， 现 在 我 们 假设 这 些 都 有 几 千 行 和 几 
千 列 的 大 矩阵 。 通 常 ， 非 稀 玻 矩阵 在 内 存 中 古 用 一 个 大 数组 表示 的 ， 第 一 行 的 所 
有 元 系 后 面 是 第 二 行 的 所 有 元 素 ， 以 此 类 推 。 为 了 实现 矩阵 相 乘 ， 现 在 就 有 三 个 
ALT « AAT BUSESEULIU ERE. WR EER SUB ER NUSUEOS TR 
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AREER LE TIE «(BBC EL cb Ba as BE ATP, ABZ a 
可 以 让 每 个 线程 计算 结果 矩阵 中 茶 些 列 的 值 ， 或 者 让 每 个 线程 计算 结果 矩阵 中 茶 


些 行 的 值 ， 或 者 甚至 让 每 个 线程 计算 结果 矩阵 中 规则 矩形 子 集 的 值 。 


回顾 8.2.3 节 和 8.2.4 节 ， 你 就 会 发 现 读 取 数 组 中 的 相 邻 元 系 比 到 处 读 取 数 组 中 
的 值 要 好 ， 因 为 这 样 减少 了 缓存 使 用 以 及 假 共享 。 如 果 你 使 每 个 线程 处 理 一 些 
列 ， 那 么 就 需要 读 取 第 一 个 矩阵 中 的 所 有 元 素 以 及 第 二 个 矩阵 中 相对 应 的 列 中 元 
素 ， 但 是 你 只 会 得 到 列 元 素 的 值 。 假 设 矩 阵 是 用 行 顺序 存储 的 ， 这 就 意味 着 你 从 
第 一 行 中 读 取 N 个 元 素 ， 从 第 二 行 中 读 取 NN 个 元 素 ， 以 此 类 推 CN 的 值 是 你 处 理 的 
列 的 数目 ) 。 别 的 线程 会 读 取 每 一 行 中 别 的 元 素 ， 这 就 很 清楚 你 应 该 读 取 相 邻 的 
的 列 ， 因 此 每 行 的 N 个 元 素 就 是 相 邻 的 ， 并 且 最 小 化 了 假 共 部 。 当 然 ， 如 宁 这 N 个 
元 素 使 用 的 空间 与 缓存 线 的 数量 相等 的 话 ， 就 不 会 有 假 共 享 ， 因 为 每 个 线程 都 会 
工作 在 独立 的 缓存 线 上 。 


男 一 方面 ， 如 果 每 个 线程 处 理 一 些 行 元 素 ， 那 么 就 需要 读 取 第 二 个 算 阵 中 的 
所 有 元 素 ， 以 及 第 一 个 矩阵 中 相关 的 行 元 素 ， 但 是 它 只 会 得 到 行 元 素 。 因 为 矩阵 
是 用 行 顺序 存储 的 ， 因 此 你 现在 读 取 从 N 行 开始 的 所 有 元 素 。 如 果 你 选择 相 邻 的 
行 ， 那么 就 意味 着 此 线程 是 现在 唯一 对 这 N 行 写 入 的 线程 ， 它 拥有 内 存 中 连续 的 
块 ， 并 且 不 会 被 别 的 线程 访问 。 这 就 比 让 每 个 线程 处 理 一 些 列 元 素 更 好 ， 因 为 唯 
一 可 能 产生 假 共 至 的 地 方 就 是 一 块 的 最 后 一 些 元 素 与 下 一 个 块 的 开始 一 些 元 素 。 
但 是 值得 花 时 间 确 认 目 标 结构 。 


第 三 种 选择 一 划分 为 矩形 块 如 何 呢 ? 这 可 以 被 看 做 是 先 划 分 为 列 ， 然 后 划分 
为 行 。 它 与 根据 列 元 素 划分 一 样 存在 假 共享 问题 。 如 果 你 可 以 选择 块 的 列 数目 来 
避免 这 种 问题 ， 那 么 从 读 这 方面 来 说 ， 划 分 为 矩形 块 有 这 样 的 优点 : 你 不 需要 读 
取 任 何 一 个 完整 的 源 和 矩阵 。 你 只 需要 读 取 相关 的 日 标 和 矩阵 的 行 与 列 的 值 。 从 具体 
方面 来 看 ， 考 上 处 两 个 1000 行 和 1000 列 的 矩阵 相 乘 。 就 有 一 百 万 个 元 素 。 如 果 你 有 
100 个 处 理 器 ， 那 么 每 个 线程 可 以 处 理 10 行 元 素 。 尽 管 如 此 ， 为 了 计算 这 10000 个 
元 素 ， 需 要 读 取 第 二 个 矩阵 的 所 有 元 素 〈( 一 百 万 个 元 素 ) 加 上 第 一 个 矩阵 相关 行 
的 10000 个 元 素 ， 总 计 1010000 个 元 素 ， 另 一 方面 ， 如 果 每 个 线程 处 理 100 行 100 列 
的 矩阵 块 〈 总 计 10000 个 元 素 ) ， 那 么 它们 需要 读 取 第 一 个 矩阵 的 100 行 元 素 
(100 x 1000=100000 个 元 素 〉 和 第 二 个 矩阵 的 100 列 元 素 〈 男 一 个 100000 个 元 
K) 。 这 就 只 有 200000 个 元 素 ， 将 读 取 的 元 素数 量 降低 到 五 分 之 一 。 如 果 你 读 取 
更 少 的 元 素 ， 那 么 发 生 缓存 未 命中 和 更 好 性 能 的 潜力 的 机 会 就 更 少 了 。 


因此 将 结果 矩阵 划分 为 小 的 方块 或 者 类 似 方块 的 矩阵 比 每 个 线程 完全 处 理 好 
几 行 更 好 。 妆 然 ， 你 可 以 调整 运行 时 每 个 块 的 大 小 ， 取 决 于 矩阵 的 大 小 以 及 处 理 
器 的 数量 。 如 果 性 能 很 重要 ， 基 于 目标 结构 分 析 各 种 选择 是 很 重要 的 。 

你 也 有 可 能 不 进行 矩阵 乘法 ， 那 么 它 是 人 否 适 用 呢 ? 当 你 在 线程 间 划 分 大 块 数 
据 的 时 候 ， 同 样 的 原则 也 适用 于 这 种 情况 。 仔 细 观 察 数 据 读 取 方 式 ， 并 且 识 别 影 
啊 性 能 的 潜在 原因 。 在 你 过 到 的 问题 也 可 能 有 相似 的 环境 ， 就 是 只 要 改变 工作 划 
分 方式 可 以 提高 性 能 而 不 需要 改变 基本 算法 。 


好 了 ， 我 们 已 经 看 到 数组 读 取 方式 是 如 何 影响 性 能 的 。 其 他 数据 结构 类 型 


=> 


We ? 


8.3.2 ”其 他 数据 结构 中 的 数据 访问 方式 
从 根本 上 说 ， 当 试图 优化 别 的 数据 结构 的 数据 访问 模式 时 也 是 适用 的 。 


。 在 线程 间 改 变数 据 分 配 ， 使 得 相 邻 的 数据 被 同一 个 线程 适用 。 
© 最 小 化 任何 给 定 线程 需要 的 数据 。 
。 确保 独立 的 线程 访问 的 数据 相隔 足够 远 来 避免 假 共享 。 


当然 ， 运 用 到 别 的 数据 结构 上 是 不 容易 的 。 例 如 ， 二 又 树 本 来 就 很 难 用 任何 
方式 来 再 分 ， 有 用 还 是 没 用 ， 取 决 于 树 是 如 何平 衡 的 以 及 你 需要 将 它 划分 为 多 少 
个 部 分 。 同 样 ， 树 的 本 质 意 味 着 结 点 是 动态 分 配 的 ， 并 且 最 后 在 堆 上 不 同 地 方 。 


现在 ， 使 数据 最 后 在 堆 上 不 同 地 方 本 身 不 是 一 个 特别 的 问题 ， 但 是 这 意味 着 
处 理 器 需要 在 缓存 中 保持 更 多 东西 。 实 际 上 这 可 以 很 有 利 。 如 果 多 个 线程 需要 志 
历 树 ， 那 么 它们 都 需要 读 取 树 的 结 点 ， 但 是 如 果树 的 结 点 至 包含 指向 该 结 点 持 有 
数据 的 指针 ， 那 么 当 需 要 的 时 候 ， 处 理 吉 就 必须 从 内 存 中 载 入 数据 。 如 有 果 线 程 正 
eee ee 
I 性 能 损失 。 


使 用 互 斥 元 保护 数据 的 时 候 也 有 同样 的 问题 。 假 设 你 有 一 个 简单 的 类 ， 它 包 
含 一 些 数据 项 和 一 个 互 斥 元 来 保护 多 线程 读 取 。 如 果 互 斥 元 和 数据 项 在 内 存 中 离 
得 很 近 ， 对 于 使 用 此 互 斥 元 的 线程 来 说 就 很 好 ; 它 需 要 的 数据 已 经 在 处 理 器 缓存 
中 了 ， 因 为 为 了 修改 互 斥 元 已 经 将 它 载 入 了 。 但 是 它 也 有 一 个 缺点 : 当 第 一 个 线 
程 持 有 互 斥 元 的 时 候 ， 如 果 别 的 线程 试图 锁 住 互 斥 元 ， 它 们 就 需要 读 取 内 存 。 互 
斥 元 的 锁 通 常 作为 一 个 在 互 斥 元 内 的 存储 单元 上 试图 获取 互 斥 元 的 读 一 修改 一 写 
原子 操作 来 实现 的 ， 如 果 互 斥 元 已 经 被 锁 的 话 ， 就 接着 调用 操作 系统 内 核 。 这 个 
读 一 修改 一 写 操作 可 能 导致 拥有 互 斥 元 的 线程 持 有 的 缓存 中 的 数据 变 得 无 效 。 只 
要 使 用 互 斥 元 ， 这 就 不 是 问题 。 尽 管 如 此 ， 如 果 互 斥 元 和 线程 使 用 的 数据 共享 同 
pui mi M 

元 而 党 到 影 啊 。 


测试 这 种 假 共享 是 否 是 一 个 问题 的 方法 就 是 在 数据 元 系 间 增加 可 以 被 不 同 的 
线程 并 发 读 取 的 大 块 填充 数据 。 例 如 ， 你 可 以 使 用 : 


struct protected data 

í 65536 字 节 是 为 了 显著 大 于 
std: :mutex m; 缓存 线 
char padding[65536]; : po 
my data data to protect; 
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struct my_data 


{ 

data iteml dl; 

data item2 d2; 

char padding[65536]; 
my data some array[256]; 

来 测试 数组 数据 是 否 假 共享 。 如 果 这 样 做 提高 了 性 能 ， 束 可 以 得 知 假 共 至 确 
实 是 一 个 问题 ， 并 且 你 可 以 保留 填充 数据 或 者 通过 重新 安排 数据 读 取 的 方式 来 消 
除 假 共享 。 

当然 ， 当 设计 并 发 性 的 时 候 ， 不 仅 需 要 考虑 数据 读 取 模 式 ， 因 此 让 我 们 来 看 
看 别 的 需要 考虑 的 方面 。 


8.4 ”为 并 发 设计 时 的 额外 考虑 


本 章 我 们 看 了 一 些 在 线程 间 划 分 工作 的 方法 ， 影 响 性 能 的 因素 ， 以 及 这 些 因 
素 是 如 何 影响 你 选择 哪 种 数据 读 取 模式 和 数据 结构 的 。 但 是 ， 设 计 并 发 代码 需要 
考虑 更 多 。 你 需要 考虑 的 事情 例如 异常 安全 以 及 可 扩展 性 。 如 果 当 系统 中 处 理 核 
心 增 加 时 性 能 《无论 是 从 减少 执行 时 间 还 是 从 增加 吞吐 量 方面 来 说 ) 也 增加 的 
话 ， 那 么 代码 就 是 可 扩展 的 。 从 理论 上 说 ， 性 能 增加 是 线性 的 。 因 此 一 个 有 100 
个 处 理 器 的 系统 的 性 能 比 只 有 一 个 处 理 器 的 系统 好 100 倍 。 


即使 代码 不 是 可 扩展 的 ， 它 也 可 以 工作 。 例 如 ， 单 线程 应 用 不 是 可 扩展 的 ， 
异常 安全 是 与 正确 性 有 关 的 。 如 果 你 的 代码 不 是 异常 安全 的 ， 就 可 能 会 以 破碎 的 
不 变量 或 者 竞争 条 件 结束 ， 或 者 你 的 应 用 可 能 因为 一 个 操作 抛 出 异常 而 突然 终 
止 。 考 虑 到 这 些 ， 我 们 将 首先 考虑 异常 安全 。 


8.4.1 并行 算 法 中 的 异常 安全 


异常 安全 是 好 的 C++ 代 码 的 一 个 基本 方面 ， 使 用 并 发 性 的 代码 也 不 例外 。 实 
际 上 ， 并 行 算法 通常 比 普通 线性 算法 需要 你 考虑 更 多 关于 异常 方面 的 问题 。 如 果 
线性 算法 中 的 操作 抛 出 异常 ， 该 算法 只 要 考虑 确保 它 能 够 处 理 好 以 避免 资源 泄漏 
和 破碎 的 不 变量 。 它 可 以 允许 扩大 有 异常 给 调用 者 来 处 理 。 相 比 之 下 ， 在 并 行 算法 
中 ， 很 多 操作 在 不 同 的 线程 上 运行 。 在 这 种 情况 下 ， 就 不 允许 扩大 异常 了 ， 因 为 
er arene or enn 
就 会 和 从 上 上。 


作为 一 个 具体 的 例子 ， 我 们 来 回顾 清单 2.8 中 的 parallel_accumulate 郴 
数 ， 清 单 8.2 中 会 做 一 些 修 改 。 


清单 8.2 std::accumulate 的 并 行 版 本 (来自 清单 2.8) 


template<typename Iterator,typename T> 
struct accumulate block 


{ 


void operator() (Iterator first,Iterator last,T& result} 


{ 
} 


result-std::accumulate(first,last,result); 0 


bh 


template«typename Iterator,typename T» 
T parallel accumulate(Iterator first,Iterator last,T init) 


{ 


unsigned long const length-std::distance(first,last); -© 


if(!length) 
return init; 


unsigned long const min per thread-25; 
unsigned long const max threads- 
(length«min per thread-1)/min per thread; 


unsigned long const hardware threads- 
std::thread::hardware concurrency(); 


unsigned long const num threadsz 
std::min(hardware threads!-0?hardware threads:2,max threads); 


unsigned long const block size-length/num threads; 


Std::vector«T» results(num threads); 
std::vector<std::thread>  threads(num threads-1); 0 


Iterator block_start=first; -O 
for (unsigned long i=0;i<(num_threads-1);++i) 
{ 
Iterator block end-block start; +0 
std: :advance (block_end,block_size); 
threads [i] =std: :thread{ 
accumulate_block<Iterator,T>(), 
block start,block end,std::ref(results[i])); 
block start-block end; 


) 


accumulate block()(block start,last,results[num threads-1]); 0O 


std::for each(threads.begin(),threads.end(), 
std::mem fn(&std::thread::join)); 


return std::accumulate(results.begin(),results.end(),init); 4 [10] 


现在 我 们 检查 并 且 确 定 抛 出 异常 的 位 置 : 总 的 说 来 ， 任 何 调用 函数 的 地 方 或 
者 在 用 户 定义 的 类 型 上 执行 操作 的 地 方 都 可 能 抛 出 异常 。 


首先 ， 你 调用 distance@， 它 在 用 户 定义 的 迭代 器 类 型 上 执行 操作 。 因 为 你 
还 没有 进行 任何 工作 ， 并 且 这 是 在 调用 线程 上 ， 所 以 这 是 没 问 题 的 。 下 一 步 ， 你 
分 配 了 results 迭 代 器 全 和 threads 和 迭代 器 四 .同样 ， 这 是 在 调用 线程 上 ， 并 且 


你 没有 做 任何 工作 或 者 生产 任何 线程 ， 因 此 这 是 没 问 题 的 。 当 然 ， 如 果 threads 
构造 函数 抛 出 异常 ， 那 么 就 必须 清楚 为 results 分 配 的 内 存 ， 析 构 函 数 将 为 你 完 


跳 过 block_start 的 初始 化 人 @ 因 为 这 是 安全 的 ， 就 到 了 产生 线程 的 循环 中 的 
操作 @、@、 全 .一 旦 在 @ 中 创造 了 第 一 个 线程 ， 如 果 抛 出 异常 的 话 就 会 很 麻 
烦 ， 你 的 新 std: :thread 对 象 的 析 构 函数 会 调用 std: :terminate 然 后 中 止 程 
序 。 


调用 accumulate_b1lock@@ 也 可 能 会 抛 出 异常 ， 你 的 线程 对 象 将 被 销毁 并 且 
调用 std: :terminate; 另 一 方面 ， 最 后 调用 std: :accumulate 人 多 的 时 候 也 可 能 
抛 出 异常 并 且 不 导致 任何 困难 ， 因 为 所 有 线程 将 在 此 处 汇合 。 


这 不 是 对 于 主线 程 来 说 的 ， 但 是 也 可 能 抛 出 异常 ， 在 新 线程 上 调 
用 accumulate_block 可 能 抛 出 异常 @。 这 里 没有 任何 catch 块 ， 因 此 该 异常 将 
被 稍 后 处 理 并 且 导 致 库 调用 std: :terminate() 来 中 止 程序 。 
即使 不 是 显而易见 的 ， 这 段 代 码 也 不 是 异常 安全 的 。 
1. 增加 异常 安全 性 


好 了 ， 我 们 识别 出 了 所 有 可 能 抛 出 异常 的 地 方 以 及 异常 所 造成 的 不 好 影响 。 
那么 如 何 处 理 它 呢 ?我 们 先 来 解决 在 新 线程 上 抛 出 异常 的 问题 。 


在 第 4 章 中 介绍 了 完成 此 工作 的 工具 。 如 果 你 仔细 考虑 在 新 线程 中 想 获得 什 
么 ， 那 么 很 明显 当 人 允许 代码 抛 出 异常 的 时 候 ， 你 试图 计算 结果 来 返 
la], std::packaged _ task 和 std: :future 的 组 合 设计 是 恰好 的 。 如 果 你 重新 设 
计 代 码 来 使 用 std: :packaged_task， 就 以 清单 8.3 中 的 代码 结 


清单 8.3 ”使 用 std::packaged_task 的 std::accumulate 的 并 行 版 本 


template<typename Iterator,typename T> 
struct accumulate_block 


{ 


T operator() (Iterator first,Iterator last) 0 
{ 

return std::accumulate(first,last,T()); -O 
} 


template<typename Iterator,typename T> 
T parallel accumulate(Iterator first,Iterator last,T init) 


{ 


unsigned long const length=std::distance(first,last) ; 


if(!length) 
return init; 


unsigned long const min per thread-25; 
unsigned long const max threads- 
(length«min per thread-1)/min per thread; 


unsigned long const hardware threads- 
std::thread::hardware concurrency(); 


unsigned long const num threads- 
std: :min (hardware threads!-0?hardware threads:2,max threads); 


unsigned long const block size-length/num threads; 


Std::vector«std::future«T» > futures(num threads-1); -© 
Std::vector«std::thread» threads(num threads-1); 


Iterator block start-first; 
for (unsigned long i=0;i< (num_threads-1} ;++i) 
{ 
Iterator block_end=block_start; 
std: : advance (block_end,block_size) ; 
std: :packaged_task<T(Iterator,Iterator}> task( «o 
accumulate block«Iterator,T»()); ,9 
futures[il]-task.get future(); 
threads [i]-std::thread(std::move(task),block start,block end); -© 
block start=block end; 


) 


T last result-zaccumulate block() (block start,last); —9 


std::for each(threads.begin(),threads.end(), 
std::mem f£ní(&std::thread::join)); 


T result-init; «09 


for (unsigned long i=0;i< (num_threads-1)} ; ++i) 


{ 
} 


result += last_result; < 
return result; 


result+=futures [i] .get(); -© 


第 一 个 改变 就 是 ， 函 数 调 用 accumulate_block 操 作 直 接 返 回 结 果 ， 而 不 是 
返回 存储 地 址 的 引用 @。 你 使 用 std: :packaged_task 和 std: :future 来 保证 异 
常安 全 ， 因 此 你 也 可 以 使 用 它 来 转移 结果 。 这 就 需要 你 调用 std::accumulate@ 
a eae em eel 不 过 这 只 是 一 个 小 小 的 
IP s 


下 一 个 改变 就 是 你 用 futures 疝 量 人 @， 而 不 是 用 结果 为 每 个 生成 的 线程 存储 
一 个 std: :future<T>。 在 生成 线程 的 循环 中 ， 你 首先 为 accumulate_block 创 


ik—^MEAO. std::packaged task<T(Iterator,Iterator)> 声 明了 有 两 
个 Iterator 并 且 返 回 一 个 T 的 任务 ， 这 就 是 你 的 函数 所 做 的 。 然 后 你 将 得 到 任务 
的 future 加 ， 并 且 在 一 个 新 的 线程 上 运行 这 个 任务 ， 输 入 要 处 理 的 块 的 起 点 和 终点 
@。 当 运行 任务 的 时 候 ， 将 在 future 中 捕捉 结果 ， 也 会 捕捉 任何 抛 出 的 异常 。 


既然 你 已 经 使 用 了 future， 就 不 再 有 结果 数组 了 ， 因 此 必须 将 最 后 一 块 的 结果 
存储 在 一 个 变量 中 人 @ 而 不 是 存储 在 数组 的 一 个 位 置 中 。 同 样 ， 因 为 你 将 从 future 中 
得 到 值 ， 使 用 基本 的 for 循 环比 使 用 std: :accumulate 要 简单 ， 以 提供 的 初始 值 
开始 @， 并 且 将 每 个 future 的 结果 累加 起 来 @@。 如 果 相应 的 任务 抛 出 异常 ， 就 会 在 
future 中 捕捉 到 并 且 调用 get( ) 时 会 再 次 抛 出 异常 。 最 后 ， 在 返回 总 的 结果 给 调用 
者 之 前 要 加 上 最 后 一 个 块 的 结果 四 。 


因此 ， 这 就 去 除了 一 个 可 能 的 问题 ， 工 作 线程 中 抛 出 的 异常 会 在 主线 程 中 再 
次 被 抛 出 。 如 果 多 于 一 个 工作 线程 抛 出 异常 ， 只 有 一 个 异常 会 被 传播 ， 但 是 这 也 
不 是 一 个 大 问题 。 如 果 确 实 有 关 的 话 ， 可 以 使 用 类 似 std: :nested_exception 
来 捕捉 所 有 的 异常 然后 抛 出 它 。 

如 果 在 你 产生 第 一 个 线程 和 你 加 入 它们 之 间 抛 出 异常 的 话 ， 那 么 剩 下 的 问题 
就 是 线程 泄漏 。 最 简单 的 方法 就 是 捕获 所 有 异常 ， 并 且 将 它们 融合 到 调 
用 joinable() 的 线程 中 ， 然 后 再 次 抛 出 异常 。 


try 


{ 


for(unsigned long i=0;i<(num_threads-1) ;++1i) 


{ 
} 


T last_result=accumulate_block() (block_start,last); 


// ... as before 


std::for each(threads.begin(),threads.end(), 
std::mem fn(&std::thread::join)); 


} 
Catch(...) 
{ 
for(unsigned long i=0;i< (num thread-1) ;++i) 
{ 
if (threads [i] .joinable() } 
thread[i] .join() ; 
} 
throw; 
} 


现在 它 起 作用 了 。 所 有 线程 将 被 联合 起 来 ， 无 论 代 码 是 如 何 离开 块 的 。 尽 管 


如 此 ，try-catch 块 是 令 人 讨厌 的 ， 并 且 你 有 复制 代码 。 你 将 加 入 正音 的 控制 流 
以 及 捕获 块 的 线程 中 。 复 制 代码 不 是 一 个 好 事情 ， 因 为 这 意味 着 需要 改变 更 多 的 
地 方 。 我 们 在 一 个 对 象 的 析 构 函数 中 检查 它 ， 毕 部， 这 是 C++ 中 惯用 的 清除 资源 
的 方法 。 下 面 是 你 的 类 。 


class join threads 
{ 
std::vector«std::thread»& threads; 
public: 
explicit join threads(std::vector«std::thread»& threads ): 
threads (threads ) 
Ü 


-join threads() 


{ 


for (unsigned long i=0;i<threads.size() ;++i) 


{ 
if (threads [i] .joinable()) 
threads [i] .join(); 


这 与 清单 2.3 中 的 thread_guard 类 是 相似 的 ， 除 了 它 扩 展 为 适合 所 有 线程 。 
你 可 以 如 清单 8.4 所 示 简 化 代码 。 


清单 8.4。 std::accumulate 的 异常 安全 并 行 版 本 


template<typename Iterator,typename T> 
T parallel accumulate(Iterator first,Iterator last,T init) 


{ 


unsigned long const length=std: :distance (first, last) ; 


if(!length) 
return init; 


unsigned long const min per thread-25; 
unsigned long const max threads- 
(length«min per thread-1)/min per thread; 


unsigned long const hardware threads- 
std: :thread: :hardware_concurrency () ; 


unsigned long const num_threads= 
std: :min(hardware_threads!=0?hardware_threads:2,max_threads) ; 


unsigned long const block_size=length/num_threads; 


std: :Vector<std: :future<T> > futures (num threads-1) ; 
std: :vector<std: :thread> threads{num_threads-1) ; 
join threads joiner (threads); 0 


Iterator block_start=first; 
for (unsigned long i=0;i< (num_threads-1) ; ++i) 
{ 
Iterator block_end=block_start; 
std: :advance (block_end, block size); 
std: :packaged_task<T (Iterator, Iterator)> task ( 
accumulate block«Iterator,T»()); 
futures[i]-task.get future(); 


threads [i] =std: :thread (std: :move (task) ,block_start,block_end) ; 
block start-block end; 

) 

T last result-accumulate block() (block start,last); 

T resultzinit; 

for (unsigned long i-0;i«(num threads-1);-««i) 


{ 
} 


result += last_result; 
return result; 


result+=futures [i] .get(); EXE 2) 
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出 的 线程 。 你 可 以 去 除 你 的 联合 循环 ， 只 要 你 知道 无 论 函数 是 否 退 出 ， 这 些 线程 
都 将 被 联合 起 来 。 注 意 调用 futures[i].get() 人 @ 将 被 阻塞 直到 结果 出 来 ， 因 此 
在 这 一 点 并 不 需要 明确 地 与 线程 融合 起 来 。 这 与 清单 8.2 中 的 原型 不 一 样 ， 在 清单 
8.2 中 你 必须 与 线程 联合 起 来 确保 正确 复制 了 结果 向 量 。 你 不 仅 得 到 了 异常 安全 代 
> 而 且 你 的 函数 也 更 短 了 ， 因 为 将 联合 代码 提取 到 你 的 新 (可 再 用 的 〉 类 中 


2. STD::ASYNC0O 的 异常 安全 


你 已 经 知道 了 当 处 理 线程 时 需要 什么 来 实现 异常 安全 ， 我 们 来 看 看 使 
用 std: :async() 时 需要 做 的 同样 的 事情 。 你 已 经 看 到 了 ， 在 这 种 情况 下 库 为 你 
处 理 这 些 线程 ， 并 且 当 future 是 就 绪 的 时 候 ， 产 生 的 任何 线程 都 完成 了 。 需 要 注意 
到 关键 事情 就 是 异常 安全 ， 如 果 销 筑 future 的 时 候 没有 等 待 它 ， 析 构 函 数 将 等 待 线 
程 完成 。 这 就 避免 了 仍然 在 执行 以 及 持 有 数据 引用 的 泄漏 线程 的 问题 。 清 单 8.5 所 
示 就 是 使 用 std: :async() 的 异常 安全 实现 。 


清单 8.5 使 用 std::async 的 std::accumulate 的 异常 安全 并 行 版 本 


template<typename Iterator,typename T> 

T parallel accumulate(Iterator first,Iterator last,T init) 

{ 
unsigned long const length=std::distance(first,last) ; 0 
unsigned long const max_chunk_size=25; 
if (length<=max_chunk_size) 


{ 
} 


else 
{ 
Iterator mid point-first; 
std::advance(mid point,length/2); ag 
std::future<T> first_half_result= 
std: :async (parallel _accumulate<Iterator,T>, 0 
first,mid_point,init) ; 


return std: :accumulate(first,last,init) ; iQ 


T second half resultszparallel accumulate(mid point,last,T()); ag 
return first half result.get ()+second_half_result; ^e 


这 个 版 本 使 用 递归 将 数据 划分 为 块 而 不 是 重新 计算 将 数据 划分 为 块 ， 但 是 它 
比 之 前 的 版 本 要 简单 一 些 ， 并 且 是 异常 安全 的 。 如 以 前 一 样 ， 你 以 计算 序列 长 度 
开始 @， 如 果 它 比 最 大 的 块 尺寸 小 的 话 ， 就 直接 调用 std: :accumulate 人 全。 如 果 
它 的 元 素 比 块 尺寸 大 的 话 ， 就 找到 中 点 @ 然 后 产生 一 个 异步 任务 来 处 理 前 半 部 分 ! 
[序号 人 全。 范围 内 的 第 二 部 分 就 用 一 个 直接 的 递归 调用 来 处 理 人 全， 然后 将 这 两 个 块 
的 结果 累加 @。 库 确保 了 std: :async 调 用 使 用 了 可 获得 的 硬件 线程 ， 并 且 没 有 
创造 很 多 线程 。 一 些 “ 异 步调 用 将 在 调用 get() 的 时 候 被 异步 执行 @。 


这 种 做 法 的 好 处 在 于 它 不 仅 可 以 利用 硬件 并 发 ， 而 且 它 也 是 异常 安全 的 。 如 
果 递 归 调 用 抛 出 异常 人 @， 当 异常 传播 时 ， 调 用 std: :async@ 创 造 的 future 就 会 被 
销毁 。 它 会 轮流 等 待 异步 线程 结束 ， 因 此 避免 了 甚 挂 线程 。 另 一 方面 ， 如 果 异 步 
调用 抛 出 异常 ， 就 会 被 future 捕 捉 ， 并 且 调 用 get()@ 将 再 次 抛 出 异常 。 


当 设 计 并 发 代码 的 时 候 还 需要 考虑 哪些 方面 呢 ? 让 我 们 来 看 看 可 扩展 性 。 如 
果 将 你 的 代码 迁移 到 更 多 处 理 器 系统 中 会 提高 多 少 性 能 呢 ? 


8.4.2 ”可 扩展 性 和 阿 姆 达 和 尔 定律 


可 扩展 性 是 关于 确保 你 的 应 用 可 以 利用 系统 中 增加 的 处 理 器 。 一 种 极端 情况 
就 是 你 有 一 个 完全 不 能 扩展 的 单线 程 应 用 ， 即 使 你 在 系统 中 增加 100 个 处 理 器 也 
不 会 改变 性 能 。 另 一 种 极端 情况 是 你 有 类 似 SETI@Homel3l 的 项 目 ， 被 设计 用 来 利 
用 成 千 上 万 的 附加 的 处 理 器 《以 用 户 将 个 人 计算 机 增加 到 网 络 中 的 形式 ) 。 


对 于 任何 给 定 的 多 线程 程序 ， 当 程序 运行 时 ， 执 行 有 用 工作 的 线程 的 数量 会 
发 生变 化 。 即 使 每 个 线程 都 在 做 有 用 的 操作 ， 初 始 化 应 用 的 时 候 可 能 只 有 一 个 线 
程 ， 然 后 就 有 一 个 任务 生成 其 他 的 线程 。 但 是 即使 那样 也 是 一 个 不 太 可 能 发 生 的 
方案 。 线 程 经 种 伦 时 间 等 竺 彼此 或 者 等 待 O 操 作 完 成 。 


除非 每 次 线程 等 竺 事情 《无 论 是 什么 事情 ) 的 时 候 都 有 另 一 个 线程 在 处 理 咒 
F 代 蔡 它 ， 否 则 就 有 一 个 可 以 进行 有 用 工作 的 处 理 器 处 于 闲置 状态 。 


一 种 简单 的 方法 就 是 将 程序 划分 为 只 有 一 个 线程 在 做 有 用 的 工作 “ 串 行 的 ”部 
分 和 所 有 可 以 获得 的 处 理 器 都 在 做 有 用 工作 的 “并 行 的 ”部 分 。 如 果 你 在 有 更 多 处 
理 器 的 系统 上 运行 你 的 应 用 ， 理 论 上 就 可 以 更 快 地 完成 < 并行” 部 分 ， 因 为 可 以 在 
更 多 的 处 理 器 间 划 分 工作 ， 但 是 “ 串 行 的 ?部 分 仍然 是 串 行 的 。 在 这 样 一 种 简单 假 
设 下 ， 你 可 以 通过 增加 处 理 器 数量 来 估计 可 以 获得 的 性 能 。 如 果 “ 连 续 的 ”部 分 组 
成 程序 的 一 个 部 分 /:， 那 么 使 用 N 个 处 理 器 获得 的 性 能 P 就 可 以 估计 为 


P= 


这 就 是 阿 姆 达 尔 定律 CAmdahl'slaw) ， 当 谈论 并 发 代码 性 能 的 时 候 经 常 被 
引用 。 如 果 所 有 事情 都 能 被 并 行 ， 那 么 串 行 部 分 就 为 0， 加 速 就 是 N。 或 者 ， 如 果 
串 行 部 分 是 三 分 之 一 ， 即 使 有 无 限 多 的 处 理 器 ， 你 也 不 会 得 到 超过 3 的 加 速 。 


尽管 如 此 ， 这 是 一 种 很 理想 的 情况 。 因 为 任务 很 少 可 以 像 方程 式 所 需要 的 那 
样 被 无 穷 划 分 ， 并 且 所 有 事情 都 达到 它 所 假设 的 CPU 界限 是 很 少 出 现 的。 正如 你 
看 到 的 ， 线 程 执 行 的 时 候 会 等 竺 很 多 事情 。 


阿 姆 达尔 定律 中 有 一 点 是 明确 的 ， 那 就 是 当 你 为 性 能 使 用 并 发 的 时 候 ， 值 得 
考虑 总 体 应 用 的 设计 来 最 大 化 并 发 的 可 能 性 ， 并 且 确 保 处 理 器 始终 有 有 用 的 工作 
来 完成 。 如 果 你 可 以 减少 “ 串 行 "部 分 或 者 减少 线程 等 待 的 可 能 性 ， 你 就 可 以 提高 
在 有 更 多 处 理 器 的 系统 上 的 性 能 。 或 者 ， 如 果 你 可 以 为 系统 提供 更 多 的 数据 ， 并 
且 保 持 并 行 部 分 准备 工作 ， 就 可 以 减少 串 行 部 分 ， 增 加 性 能 P 的 值 。 


从 根本 上 说 ， 可 扩展 性 就 是 当 增 加 更 多 的 处 理 器 的 时 候 ， 可 以 减少 它 执 行 操 


作 的 时 间或 者 增加 在 一 段 时 间 内 处 理 的 数据 数量 。 有 时 这 两 点 是 相同 的 《如 果 每 
个 元 素 可 以 处 理 得 更 快 ， 那 么 你 就 可 以 处 理 更 多 数据 ) ， 但 是 并 不 总 是 一 样 的 。 
Lo DAR CURE came UU UR Ut ne 
很 必要 的 。 


在 这 部 分 的 开始 我 就 提 到 过 线程 并 不 是 总 有 有 用 的 工作 来 做 。 有 时 它们 必须 
等 待 别 的 线程 ， 或 者 等 待 JO 操 作 完成 ， 或 者 别 的 事情 。 如 果 在 等 待 中 你 给 系统 一 
些 有 用 的 事情 ， 你 就 可 以 有 效 的 “隐藏 "等待 。 


8.4.3 用 多 线程 隐藏 延迟 


在 很 多 关于 多 线程 代码 性 能 的 讨论 中 ， 我 们 都 假设 当 它 们 真正 在 处 理 器 上 运 
行 时 ， 线 程 在 “全 力 以 赴 ” 的 运行 并 且 总 是 有 有 用 的 工作 来 做 。 这 当然 不 是 正确 
的 ， 在 应 用 代码 中 ， 线 程 在 等 得 的 时 候 总 是 频繁 地 被 阻塞。 例如， 它们 可 能 在 等 
竺 一些 VO 操作 的 完成 ， 等 待 获得 互 斥 元 ， 等 待 男 一 个 线程 完成 一 些 操作 并 且 通 知 
一 个 条 件 变量 ， 或 者 只 是 休眠 一 段 时 间 。 


无 论 等 待 的 原因 是 什么 ， 如 果 你 只 有 和 系统 中 物理 处 理 单元 一 样 多 的 线程 ， 
那么 有 阻 寨 的 线程 就 意味 着 你 在 浪费 CPU 时 间 。 运 行 一 个 被 阻塞 的 线程 的 处 理 器 
不 做 任何 事情 。 因 此 ， 如 果 你 知道 一 个 线程 将 会 有 相当 一 部 分 时 间 在 等 待 ， 那 么 
你 就 可 以 通过 运行 一 个 或 多 个 附加 线程 来 使 用 那个 空闲 的 CPU 时 间 。 


考虑 一 个 病毒 扫描 应 用 ， 它 使 用 管道 在 线程 间 划 分 工作 。 第 一 个 线程 搜索 文 
件 系统 来 检查 文件 并 且 将 它们 放 到 队列 中 。 同 时 ， 男 一 个 线程 获得 队列 中 的 文件 
名 ， 载 入 文件 ， 并 且 扫 描 它 们 的 病毒 。 你 知道 搜索 文件 系统 的 文件 来 扫描 的 线程 
肯定 会 达到 IO 界限 ， 因 此 你 就 可 以 通过 运行 一 个 附加 的 扫描 线程 来 使 用 “空闲 
的 ?CPU 时间。 那么 你 就 有 一 个 搜索 文件 线程 ， 以 及 与 系统 中 的 物理 核 或 者 处 理 器 
相同 数量 的 扫描 线程 。 因 为 扫描 线程 可 能 也 不 得 不 从 磁盘 读 取 文 件 的 重要 部 分 来 
扫描 它们 ， 拥 有 更 多 扫描 线程 也 是 很 有 意义 的 。 但 是 在 茶 个 时 刻 会 有 太 多 线程 ， 
系统 会 再 次 慢 下 来 因为 它 花 了 更 多 时 间 切 换 程 序 ， 正 如 8.2.5 节 所 描述 的 。 


仍然 ， 这 是 一 个 最 优化 问题 ， 因 此 测量 线程 数量 改变 前 后 的 性 能 时 很 重要 
人 
列 。 


取决 于 应 用 ， 它 也 可 能 用 完 室 闲 的 CPU 时 间 而 没有 运行 附加 的 线程 。 例 如 ， 
如 果 一 个 线程 因为 等 待 O 操 作 的 完成 而 被 阻塞 ， 那 么 使 用 可 获得 的 异步 7O 操 作 
就 很 有 意义 了 。 那 么 当 在 背后 执行 WO 操作 的 时 候 ， 线 程 就 可 以 执行 别 的 有 用 的 工 
作 了 。 在 别 的 情况 下 ， 如 果 一 个 线程 在 等 待 另 一 个 线程 执行 一 个 操作 ， 那 么 等 符 
的 线程 就 可 以 自己 执行 那个 操作 而 不 是 被 阻塞 ， 正 如 第 7 章 中 的 无 锁 队 列 。 在 一 
个 极 问 的 情况 下 ， 如 果 线 程 等 待 完成 一 个 任务 并 且 该 任务 没有 被 其 他 线程 执行 ， 
等 待 的 线程 可 以 在 它 内 部 或 者 男 一 个 未 完成 的 任务 中 执行 这 个 任务 。 清 单 8.1 中 你 
看 到 了 这 个 例子 ， 在 排序 程序 中 只 要 它 需 要 的 块 没 有 排 好 序 就 不 停 地 排序 它 。 


有 时 它 增 加 线程 来 确保 外 部 事件 及 时 被 处 理 来 增加 系统 响应 性 ， 而 不 是 增加 
线程 来 确保 所 有 可 得 到 的 处 理 器 都 被 应 用 了 。 


8.4.4 用 并 发 提高 啊 应 性 

很 多 现代 图 形 用 户 接 口 框架 是 事件 驱动 的 ， 使 用 者 通过 键盘 输入 或 者 移动 刀 
标 在 用 户 接 口上 执行 操作 ， 这 会 产生 一 系列 的 事件 或 者 消息 ， 稍 后 应 用 就 会 处 理 
它 。 系 统 自 己 也 会 产生 消息 或 者 事件 。 为 了 确保 所 有 事件 和 消息 都 能 被 正确 处 
理 ， 通 常 应 用 都 有 下 面 所 示 的 一 个 事件 循环 。 


while (true) 


( 
event data event-zget eventí); 
if (event.type--quit) 
break; 
process (event); 
} 


显然 ，API 的 细节 是 不 同 的 ， 但 是 结构 通常 是 一 样 的 ， 等 待 一 个 事件 ， 做 需 
要 的 操作 来 处 理 它 ， 然 后 等 待 下 一 个 事件 。 如 果 你 有 单线 程 应 用 ， 就 会 导致 长 时 
间 运 行 的 任务 很 难 被 号 入 ， 如 8.1.3 节 描述 的 。 为 了 确保 用 户 输入 能 被 及 时 处 
理 ，get_event() 和 process() 必 须 以 合理 的 频率 被 调用 ， 无 论 应 用 在 做 什么 操 
作 。 这 就 意味 着 要 么 任务 必须 定期 暂停 并 且 将 控制 交 给 事件 循环 ， 要 么 方便 的 时 
人 ()/process() 代 码 。 每 一 种 选择 都 将 任务 的 实现 变 得 

ART. 


通过 用 并 上 有 分离 关 注 点 ， 你 就 可 以 将 长 任务 在 一 个 新 线程 上 执行 ， 并 且 用 一 
个 专用 的 GUI 线程 来 处 理事 件 。 线 程 可 以 通过 简单 的 方法 互相 访问 ， 而 不 是 必须 
pe 6 d 。 清 单 8.6 列 出 了 这 种 分 离 的 简单 概 


清单 8.6 ”从 任务 线程 中 分 离 GUI 线 程 


std: :thread task thread; 
std: :atomic<bool> task cancelled(false); 


void gui thread() 


{ 


while (true) 
{ 
event data event=get_event({); 
if (event .type==quit) 
break; 
process (event); 


void task() 


{ 


while(!task complete() && !task cancelled) 


{ 
} 


if (task. cancelled) 


{ 
} 
else 


{ 
} 


do next operation(); 


perform cleanup(); 


post gui event {task complete); 


} 


void process(event data const& event) 


{ 


switch (event .type} 

{ 

case start task: 
task cancelled-false; 
task threadzstd::thread(task); 
break; 

case stop task: 
task cancelled-true; 
task thread.join(); 
break; 

case task complete: 
task thread.join(); 
display results(); 
break; 

default: 
di vule 


通过 这 种 方式 分 离 障 碍 ， 用 户 线程 能 够 及 时 地 啊 应 事件 ， 即 使 任务 要 执行 很 
长 时 间 。 这 种 啊 应 性 通常 是 使 用 应 用 时 用 户 体 验 的 关键 。 无 论 何 时 执行 一 个 特定 
操作 (无论 该 操作 是 什么 ) ， 应 用 都 会 被 完全 锁 住 ， 这 样 使 用 起 来 就 不 方便 了 。 
通过 提供 一 个 专用 的 事件 处 理 线程 ，GUI 可 以 处 理 GUI 特 有 的 消息 (例如 调整 窗 
口 大 小 或 者 重 画 窗口 ) 而 不 会 中 断 耗 时 处 理 的 执行 ， 并 且 当 它们 确实 影响 长 任务 
时 会 传递 相关 的 消息 。 


本 章 你 看 到 了 设计 并 发 代码 的 时 候 需要 考虑 的 问题 。 就 整体 而 言 ， 这 些 问 题 
是 很 大 的 ， 但 是 当 你 习惯 了 “多 线程 编程 "， 它 们 就 会 变 得 得 心 应 手 了 。 如 果 这 些 
考虑 对 你 来 说 很 新 ， 那 么 希望 当 你 看 到 它们 是 如 何 影响 多 线程 代码 的 具体 例子 的 
时 候 ， 可 以 变 得 更 清晰 。 


85 在 实践 中 设计 并 及 代码 


当 为 一 个 特别 的 任务 设计 并 发 代码 的 时 候 ， 你 需要 事先 考虑 每 个 描述 的 问题 
的 程度 将 取决 于 任务 。 为 了 演示 它们 是 如 何 应 用 的 ， 我 们 将 看 看 C++ 标准 库 中 三 
个 函数 并 行 版 本 的 实现 。 这 将 给 你 一 个 类 似 的 构造 基础 ， 提 供 了 考虑 问题 的 平 
台 。 作 为 奖励 ， 我 们 也 有 可 用 的 函数 实现 ， 可 用 来 帮助 并 行 一 个 更 大 的 任务 。 


我 选择 这 些 实现 主要 是 用 来 演示 特别 的 方法 而 不 是 成 为 最 高 水 平 的 实现 。 在 
并 行 算法 学 术 文献 或 者 在 多 线程 库 例如 Inter's Threading Building Blocks'^!rp nf EJ 
找到 更 高 程度 的 实现 ， 它 们 更 好 地 利用 了 可 获得 的 硬件 并 发 性 。 

概念 上 最 简单 的 并 行 算法 是 std: :for_each 的 并 行 版 本 ， 我 们 就 先 从 它 。” 开 
始 。 


8.5.1 std::for_each 的 并 行 实 现 


std: :for_each 在 概念 上 很 简单 ， 它 轮流 在 范围 内 的 每 个 元 系 上 调用 用 户 提 
供 的 函数 。std: :for_each 的 并 行 实现 和 串 行 实现 的 最 大 区 别 就 是 函数 调用 的 顺 
序 。std: :for_each 用 范围 内 的 第 一 个 元 素 调用 函数 ， 然 后 是 第 二 个 ， 以 此 类 
推 。 然 而 使 用 并 行 实现 就 不 能 保证 元 素 补 处理 的 顺序 ， 它 们 可 能 (实际 上 我 们 希 
望 ) 被 并 发 处 理 。 


为 了 实现 并 行 版 本 ， 你 只 需要 将 这 个 范围 划分 为 元 素 集合 在 每 个 线程 上 处 
理 。 你 事先 知道 了 元 素数 量 ， 因 此 你 可 以 在 处 理 开 始 前 划分 数据 (参见 8.1.1 
W) 。 我 们 假设 这 是 唯一 在 运行 的 并 行 任务 ， 那 么 就 可 以 使 
用 std::thread::hardware concurrency() 来 决定 线程 的 数量 。 你 也 知道 元 
素 可 以 被 独立 地 处 理 ， 因 此 你 可 以 使 用 临近 的 块 来 避免 假 共 享 〈 参 见 8.2.3 节 ) 。 


这 个 算法 与 8.4.1 节 中 描述 的 std: :accumulate 的 并 行 版 本 在 概念 上 是 类 似 
的 ， 但 是 不 计算 每 个 元 素 的 和 ， 你 只 要 应 用 具体 函数 。 尽 管 你 可 能 推测 这 会 大 大 
简化 代码 ， 因 为 它 不 返回 结果 。 如 果 你 想 传递 异常 给 调用 者 ， 你 仍然 需要 使 
用 std: :packaged _ task 和 std: :future 方 法 在 线程 间 传 递 异 常 。 一 个 简单 的 实 
现 如 清单 8.7 所 示 。 


清单 8.7 std::for each 的 并 行 版 本 


template<typename Iterator,typename Func> 
void parallel for each(Iterator first,Iterator last,Func f) 


unsigned long const length=std::distance(first,last); 


if(!length) 
return; 


unsigned long const min per thread-25; 
unsigned long const max threads- 
(length«min per thread-1)/min per thread; 


unsigned long const hardware threads- 
std::thread::hardware concurrency(); 


unsigned long const num threads- 
std::min(hardware threads!-0?hardware threads:2,max threads); 


unsigned long const block size-length/num threads; 


std: :vector<std::future<void> > futures (num threads-1); 0 
std::vector<std::thread> threads (num_threads-1); 
join threads joiner (threads); 


Iterator block start-first; 
for {unsigned long iz0;i«(num threads-1) ;++i) 


Iterator block end-block start; 

Std::advance(block end,block size); 

Std::packaged task«void(void)» task( iQ 
(310 


{ 
std::for each(block start,block end,f); 
Di 
futures[i]-task.get future(); 
threads[i]-std::thread(stdá::move(task)); 469 
block start-block end; 


) 
std::for each(block start,last,f); 
for {unsigned long iz0;i«(num threads-1) ;++i) 


futures[i].get(); «o 


这 段 代 码 的 基础 结构 与 清单 8.4 中 的 代码 是 一 样 的 。 关 键 的 不 同 之 处 在 于 
futures 向 量 存储 了 std: :future<void>@， 因 为 工作 线程 不 返回 值 ， 并 日 在 这 
个 任务 上 使 用 一 个 简单 lambda 函 数 激活 了 从 block_start 到 block_end 范 围 上 的 
函数 f 人 办。 这 就 避免 了 将 范围 传递 给 线程 构造 函数 四 。 因 为 工作 线程 不 返回 值 ， 
调用 future[i] .get() 介 只 提供 取 回 工作 线程 抛 出 的 异常 的 方法 ， 如 果 你 不 希望 
传递 异常 ， 那 么 你 就 可 以 省 略 它 。 


正如 你 的 std: :accumulate 的 并 行 实现 可 以 通过 使 用 std: :async 被 简化 ， 


因此 你 的 parallel_for_each 也 可 以 被 简化 。 它 的 实现 如 清单 8.8 所 示 。 
清单 8.8 ”使 用 std::async 的 std::for_each 的 并 行 版 本 


template<typename Iterator,typename Func> 
void parallel for each(Iterator first,Iterator last,Punc f) 


{ 


unsigned long const length=std: :distance(first,last) ; 


if (! length) 
return; 


unsigned long const min_per_thread=25; 


if (length< (2*min_per_thread) ) 


{ 
} 


else 


{ 


std::for each(first,last,f); 9 


Iterator const mid point-first-«length/2; 
std::future<void> first half= <j £ 
std::async(&parallel for each«Iterator,Func», 

first,mid point,f); 
parallel for each(mid point,last,f); -© 


first half.get(); 
| E 


如 同 清单 8.5 中 基于 std: :async 的 parallel_accumulate 一 样 ， 你 递归 地 划 
分 数据 而 不 是 在 执行 前 划分 数据 ， 因 为 你 不 知道 库 会 使 用 多 少 线程 。 如 以 前 一 
样 ， 每 一 步 都 将 数据 划分 为 两 部 分 ， 异 步 运 行 前 半 部 分 @ 并 且 直 接 运 行 后 半 部 分 
和 直到 剩 下 的 数据 太 小 而 不 值得 划分 ， 在 这 种 情况 下 会 调用 std: :for_each®. 
使 用 std: :async 和 get() 成 员 函 数 std: :future 和 四 提供 了 异常 传播 语义 。 


证 我 们 从 必须 在 每 个 元 素 上 执行 相同 操作 的 算法 转移 到 稍微 复杂 的 例 
子 std: :find。 


8.5.2 std::find 的 并 行 实现 


std: :find 是 下 一 个 考虑 的 有 用 的 算法 ， 因 为 它 是 不 用 处 理 完 所 有 元 素 就 可 
以 完成 的 几 个 算法 之 一 。 例 如 ， 如 果 范 围 内 的 第 一 个 元 素 符 合 搜索 准则 ， 那 么 就 
不 需要 检查 别 的 元 素 。 稍 后 你 将 看 到 ， 这 是 性 能 的 一 个 重要 属性 ， 并 且 对 设计 并 
行 实 现 有 直接 影响 。 这 是 数据 读 取 部 分 可 能 影响 代码 设计 的 一 个 特殊 例子 (参见 
8.3.2 节 ) 。 这 类 别 的 算法 包括 std: :equal 和 std: :any_of。 


如 果 你 和 你 的 妻子 或 者 搭档 在 阁楼 的 两 箱 纪念 品 中 寻找 一 张 上 日 相片， 如 果 你 
找到 了 相片 就 应 该 让 他 们 也 停止 寻找 。 你 要 让 他 们 知道 你 已 经 找到 了 相片 〈 可 以 
通过 呼喊 , “找到 了 ”) ， 这 样 他 们 就 可 以 停止 寻找 并 且 做 别 的 事情 。 很 多 算法 的 
天 性 是 处 理 每 个 元 素 ， 因 此 它们 没有 呼喊 “找到 了 ”。 对 于 算法 例如 std: :find， 
早日 完成 的 能 力 是 一 个 重要 的 特性 并 且 不 浪费 任何 事情 。 因 此 你 需要 设计 你 的 代 
码 来 使 用 这 个 特性 当知 道 结果 的 时 候 用 一 些 方式 中 断 别 的 任务 ， 因 此 代码 不 
需要 等 待 别 的 工作 线程 处 理 剩 下 的 元 素 。 


如 果 你 不 中 断 别 的 线程 ， 串 行 版 本 比 并 行 版 本 的 性 能 更 好 ， 因 为 串 行 算法 一 
旦 找到 匹配 项 就 停止 搜索 并 且 返 回 。 例 如 ， 如 果 系 统 可 以 支持 四 个 并 发 线程 ， 每 
个 线程 将 检查 范围 内 四 分 之 一 的 元 素 ， 并 且 我 们 的 并 行 算法 大 约 花 费 单 个 线程 四 
分 之 一 的 时 间 来 检查 每 个 元 素 。 如 果 匹 配 的 元 素 位 于 范围 内 的 前 四 分 之 一 ， 串 行 
算法 会 首先 返回 ， 因 为 它 不 需要 检查 剩 下 的 元 素 。 


你 可 以 中 断 别 的 线程 ， 一 种 方法 是 通过 使 用 一 个 原子 变量 作为 一 个 标志 ， 并 
且 在 处 理 完 每 个 元 素 后 检查 这 个 标志 。 如 果 设 置 了 标志 ， 就 代表 有 一 个 线程 发 现 
了 匹配 项 ， 因 此 就 可 以 终止 执行 并 且 返 回 了 。 用 这 种 方法 中 断 别 的 线程 ， 你 保持 
了 你 不 需要 处 理 每 个 值 的 特性 ， 因 此 在 更 多 的 情况 下 与 串 行 版 本 相 比 提高 了 性 
能 。 这 种 方法 的 缺点 是 原子 载 入 变 成 慢 动 作 ， 这 就 会 妨碍 每 个 线程 的 前 进 。 


关于 如 何 返 回 值 和 如 何 传递 异常 你 有 两 个 选择 。 你 可 以 使 用 future 数 组 ， 使 
用 std: :packaged_task 来 转移 值 和 异常 ， 然 后 在 主线 程 中 处 理 返 回 的 结果 ; 或 
者 你 使 用 std: :promise 来 从 工作 线程 中 直接 设置 最 终结 果 。 如 果 你 希望 在 第 一 
个 异常 处 停止 (即使 你 没有 处 理 完 所 有 元 素 ) ， 你 可 以 使 用 std: :promise 来 设 
置 值 和 异常 。 另 一 方面 ， 如 果 你 希望 允许 别 的 工作 线程 继续 搜索 ， 你 可 以 使 
| 
抛 出 其 中 之 一 。 


在 这 种 情况 下 ， 我 选择 使 用 std: :promise， 因 为 行为 更 匹配 std: :find。 
这 里 要 注意 的 一 件 事 情 就 是 要 搜索 的 元 素 不 在 提供 的 范围 内 。 因 此 在 从 future 得 到 
结果 之 前 你 需要 等 待 所 有 线程 结束 。 如 果 你 在 future 上 阻塞 了 并 且 没 有 这 个 值 的 
话 ， 你 就 会 永远 等 待 。 结 果 如 清单 8.9 所 示 。 


清单 8.9 并行 find 算 法 的 一 种 实现 


template<typename Iterator,typename MatchType> 
Iterator parallel find(Iterator first,Iterator last,MatchType match) 


struct find element 0 


{ 


void operator{) (Iterator begin, Iterator end, 
MatchType match, 
std::promise<Iterator>* result, 
std::atomic<bool>* done flag) 


try 
{ 
for(;{begin!=end) && !done flag->load() ;++begin) «9 
{ 
if (*begin==match) 
{ 
result->set_value (begin) ; -© 
done flag-»store (true); —0 
return; 
} 
} 
} 
catch(...) -© 
{ 
try 
{ 
result->set_exception(std::current_exception()); <+@ 


done_flag->store (true) ; 
} 


eaten ¢....<:) 29 
{} 


m 
unsigned long const length=std::distance(first,last); 


if(!length) 
return last; 


unsigned long const min per thread-25; 
unsigned long const max threads- 
(length«min per thread-1)/min per thread; 


unsigned long const hardware threads- 
Std::thread::hardware concurrency(); 


unsigned long const num threads- 
std::min(hardware threads!-0?hardware threads:2,max threads); 


unsigned long const block size-length/num threads; 


std: :promise<Iterator> result; -© 
std::atomic«bool» done flag(false); -© 
Std::vector«std::thread» threads (num_threads-1) ; 


{ 
join threads joiner (threads); “o 


Iterator block_start=first; 
for (unsigned long i=0;i< (num_threads-1) ;++i) 
{ 
Iterator block end-block start; 
Std::advance(block end,block size); 


threads [i]-std::thread(find element(), < 
block start,block end,match, 
&result,&done flag); 

block start-block end; 


find element () (block start,last,match,&result,&done flag); «-p 
) 
if(!done flag.load()) <4 
{ 


return last; 


return result.get future().get(); «D 


} 
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数 调用 操作 上 完成 工作 @。 这 个 循环 访问 给 定 的 块 的 每 个 元 素 ， 每 一 步 都 检查 标 
志 侣 。 如 果 找 到 匹配 项 ， 就 在 promise 中 设置 最 后 的 结果 合并 且 在 返回 前 设 
置 done_flag@。 


如 果 抛 出 异常 ， 就 可 以 被 捕获 @， 并 且 在 设置 done_flag 前 在 promise 中 存 
储 异常 @。 如 果 promise 已 经 被 设置 了 ， 再 设置 值 就 有 可 能 抛 出 异常 ， 因 此 你 捕 
获 并 且 抛 弃 发 生 在 这 里 的 异常 @。 


这 就 意味 着 如 果 一 个 线程 调用 find_element， 要 么 找到 匹配 项 要 么 抛 出 异 
常 ， 此 时 所 有 别 的 线程 都 会 看 到 done_flag 被 设置 了 并 且 停 止 执行 。 如 果 多 个 线 
程 同时 找到 匹配 项 或 者 抛 出 异常 ， 它 们 就 会 在 设置 promise 值 的 时 候 产 生 苋 争 。 
但 是 这 是 一 个 没有 和 危害 的 竞争 条 件 ， 无 论 哪 一 个 线程 成 功 都 会 成 为 名 义 上 的 “第 一 
个 ”并 且 是 一 个 可 接受 的 结果 。 


回顾 主 函 数 parallel_ find 本身 ， 你 用 promise@ 和 flag@ 来 停止 搜索 ， 这 
两 者 都 传递 给 在 这 个 范围 内 搜索 的 新 线程 @@。 主 线程 也 使 用 find_element 来 搜 
索 剩 下 的 元 素 @ 罗 。 我 们 已 经 说 过 ， 你 在 检查 结果 之 前 需要 等 待 所 有 线程 结束 ， 
为 可 能 没有 匹配 的 元 素 。 你 通过 在 块 中 附 入 线程 连接 的 代码 来 完成 四 ， 因 此 当 你 
检查 标志 来 看 看 是 否 发 现 匹 配 项 的 时 候 ， 所 有 线程 都 被 联合 起 来 了 @ 国 。 如 果 发 现 
匹配 项 ， 你 就 可 以 通过 在 std: :future<iterator> 中 调用 get() 得 到 结果 或 者 抛 
出 存储 的 异常 @。 


同样 ， 这 个 实现 假设 你 将 使 用 所 有 可 获得 的 硬件 线程 或 者 你 有 别 的 方法 来 决 
定 线程 数量 ， 用 来 提前 在 线程 间 划 分 工作 。 跟 以 前 一 样 ， 在 使 用 C++ 标准 库 的 自 
动 扩 展 功 能 的 时 候 ， 你 可 以 使 用 std: :async 和 递归 数据 划分 来 简化 你 的 实现 。 
使 用 std: :async 的 parallel _ find 实现 如 清单 8.10 所 示 。 


清单 8.10 ”使 用 std::async 的 并 行 查找 算法 的 实现 


template<typename Iterator,typename MatchType> 0 

Iterator parallel_find_impl (Iterator first,Iterator last,MatchType match, 
std::atomic<bool>& done) 

{ 


try 
{ 
unsigned long const length=std::distance(first,last) ; 
unsigned long const min_per_thread=25; 
if (length<(2*min_per_thread) ) P 
{ 
for(;(first!-last) && !done.load({};++first) «D 
{ 


if (*first==match) 


done=true; 29 
return first; 
) 
) 
return last; 0O 
} 


else 
{ 
Iterator const mid_point=first+(length/2) ; 29 
std::future<Iterator> async result- 
std::async(&parallel find impl«Iterator,MatchType», a 
mid_point, last,match, std: :ref (done)); 
Iterator const direct_result= 


parallel find impl(first,mid point,match,done); «o 
return (direct result==mid point)? 
async result.get():direct result; < 

} 
} 
catch(...) 
( 

done-true; EXC] 

throw; 


} 


template<typename Iterator,typename MatchType> 
Iterator parallel_find(Iterator first,Iterator last,MatchType match) 
{ 

std::atomic<bool> done (false) ; 

return parallel find_impl (first, last,match, done) ; <Q 


如 果 你 找到 匹配 项 就 结束 查找 ， 意 味 着 你 需要 引入 一 个 在 线程 间 共 享 的 标 
志 ， 用 来 表示 已 经 找到 该 匹配 项 。 因 此 这 就 需要 传递 给 所 有 递归 调用 。 实 现 它 最 
简单 的 方法 就 是 通过 在 实现 函数 上 @ 附 加 参数 一 一 引用 done 标 志 ， 这 是 从 主 入 口 
点 传递 进来 的 @@。 


核心 实现 在 类 似 的 代码 行 里 继续 执行 。 与 很 多 实现 相同 ， 你 在 单线 程 上 设置 
处 理 项 的 最 小 值 介 。 如 果 你 不 能 将 它 划 分 为 都 至 少 达到 设置 的 大 小 的 两 部 分 ， 就 


在 当前 线程 上 运行 所 有 的 事情 仿 。 实 际 算法 是 处 理 具 体 范 围 的 简单 循环 ， 一 直 循 
环 直到 范围 结束 或 者 设置 了 done 标 志 @@。 如 果 你 查找 到 匹配 项 ， 就 在 返回 前 设 
置 done 标 志 人 全。 如 果 你 停止 查找 ， 要 么 因为 你 已 经 到 达 范 围 的 末端 ， 要么 因为 另 
一 个 线程 设置 了 done 标 志 。 你 返回 1ast 用 来 表示 在 这 里 没有 匹配 项 @. 


如 果 范 围 可 以 被 划分 ， 你 在 使 用 std: :async 前 首先 发 现 中 点 @， 以 便 在 范 
围 的 后 半 部 分 进行 查找 合 ， 小 心 使 用 std: : ref 来 传递 done 标 志 的 引用 。 同 时 ， 
你 可 以 通过 直接 递归 调用 在 范围 的 前 半 部 分 进行 查找 ©@。 如 果 原 来 的 范围 太 大 的 
话 ， 这 个 异步 调用 和 直接 递归 可 能 导致 进一步 的 划分 。 


如 果 直 接 搜 索 返 回 mid_point， 那 么 就 没有 找到 匹配 项 ， 你 就 需要 得 到 异步 
搜索 的 结果 。 如 果 那 部 分 没有 发 现 结果 ， 结 果 就 将 是 1ast， 这 是 正确 的 返回 值 表 
明 没 有 查找 到 这 个 值 四 。 如 果 “ 异 步 的 ”调用 被 延迟 而 不 是 真正 的 异步 ， 它 在 调 
用 get() 的 时 候 才 真正 运行 ， 在 这 种 情况 下 ， 如 果 在 后 半 部 分 查找 到 了 就 跳 过 搜 
索 范 围 的 前 半 部 分 。 如 果 异 步 搜索 已 经 在 另 一 个 线程 上 运行 了 ，async_result 
变量 的 析 构 函数 将 等 待 线程 完成 。 这 样 就 不 会 有 任何 泄露 线程 。 


如 同 以 前 一 样 ， 使 用 std: :async 提 供 了 异常 安全 和 异常 传递 特性 。 如 果 直 
接 递归 抛 出 异常 ，future 的 析 构 函数 将 确保 运行 异步 调用 的 线程 在 函数 返回 前 就 结 
束 了 。 并 且 如 果 异 步调 用 抛 出 异常 ， 这 个 异常 就 通过 get() 调 用 传递 人。 使 用 一 
个 try/catch 块 是 为 了 在 异常 上 设置 done 标 志 并 且 确 保 如 果 抛 出 异常 的 话 所 有 线 
EL e 没有 它 ， 实 现 仍 然 是 正确 的 ， 但 是 会 继续 检查 元 素 直 到 每 个 线程 


这 个 算法 的 两 种 实现 与 男 一 种 并 行 算法 共享 的 主要 特点 就 是 不 再 保证 项 目 按 
照 从 std: :find 得 到 的 顺序 来 处 理 。 如 果 你 想 并 行 算法 这 一 点 是 很 基础 的 。 如 果 
顺序 很 重要 的 话 ， 你 就 不 能 并 发 处 理 元 素 。 如 果 元 素 是 独立 的 ， 就 可 以 使 
用 parallel for_each。 但 是 这 意味 着 你 的 parallel _find 可 能 返回 范围 尾部 
的 元 素 ， 即 使 它 与 范围 头 部 的 元 素 匹 配 。 


好 了 ， 你 已 经 处 理 了 并 行 化 std: :find。 正 如 我 在 这 一 节 开头 说 的 那样 ， 存 
在 别 的 类 似 算 法 可 以 在 不 处 理 每 个 数据 元 素 的 情况 下 完成 ， 并 且 可 以 使 用 同样 的 
方法 。 我 们 将 在 第 9 章 中 进一步 讨论 中 断 线程 的 问题 。 


为 了 完成 我 们 的 例子 ， 我 们 将 从 不 同 的 方面 来 考虑 并 且 看 
看 std: :partial_sum。 这 个 算法 是 一 个 很 有 趣 的 并 行 算法 并 且 强 调 了 一 些 附 加 
的 设计 选择 。 


8.5.3 std::partial _ sum 的 并 行 实现 


std: :partial_sum 计 算 了 一 个 范围 内 的 总 和 ， 因 此 每 个 元 素 都 被 这 个 元 素 
与 它 之 前 的 所 有 元 素 的 和 所 代替 。 所 以 序列 1、2、3、4、5 就 变 成 1、(1+2)=3、 


(1+2+3)=6、(1+2+3+4)=10、(1+2+3+4+5)=15。 它 的 并 行 化 是 很 有 趣 的 ， 因 为 你 不 
能 将 范围 划分 为 块 然后 单独 计算 每 个 块 。 例 如 ， 第 一 个 元 素 的 原始 值 需 要 加 到 每 
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一 种 用 来 决定 范围 内 部 分 和 的 方法 就 是 计算 独立 块 的 部 分 和 ， 然 后 将 第 一 个 
块 中 计算 得 到 的 最 后 一 个 元 素 的 值 加 到 下 一 个 块 的 元 素 中 ， 并 以 此 类 推 。 如 果 你 
有 元 素 1,2,3,4,5,6,7,8,9 并 且 你 将 它 分 成 三 个 块 ， 首 先 你 得 到 {1,3,6}、{4,9,15}、 
{7,15,24}。 如 果 你 将 6 加 到 第 二 个 块 的 所 有 元 素 上 ， 你 就 得 到 {1,3,6}、 
{10,15,21}、{7,15,24}。 然 后 你 将 第 二 个 块 的 最 后 一 个 元 素 {21} 加 到 第 三 个 块 的 元 
素 上 ， 这 样 最 后 一 个 块 得 到 最 后 的 值 ，{1,3,6}、{10,15,21}、{28,36,55}。 


同 原始 划分 成 块 一 样 ， 也 可 以 并 行 加 上 前 一 个 块 的 部 分 和 。 如 果 每 个 块 的 最 
后 一 个 元 素 首 先 被 更 新 ， 那 么 当 第 二 个 线程 更 新 下 一 个 块 的 时 候 ， 第 一 个 线程 可 
以 更 新 这 个 块 中 剩 下 的 元 素 ， 并 且 以 此 类 推 。 当 列表 中 的 元 素 多 于 处 理 核 的 时 
候 ， 这 种 方法 很 有 效 ， 因 为 每 个 核 每 一 步 都 要 处 理 大 量 元 素 。 


如 果 你 有 很 多 处 理 核 〈 同 元 素数 量 一 样 ， 或 者 多 于 元 素数 量 ) ， 这 种 方法 就 
不 是 很 有 效 了 。 如 果 你 在 处 理 器 间 划 分 工作 ， 第 一 步 以 元 素 对 结束 工作 。 这 这 种 
条 件 下 ， 这 种 进一步 传递 结果 意味 着 很 多 处 理 器 会 等 待 ， 因 此 你 需要 给 它们 分 配 
工作 。 你 可 以 采用 男 一 种 方法 对 待 这 个 问题 。 你 做 部 分 传递 ， 而 不 是 从 一 个 块 到 
下 一 个 块 做 全 部 和 的 传递 。 首 先 像 之 前 一 样 求 和 相 邻 的 元 素 ， 然 后 将 这 些 和 加 到 
与 它 相 隔 两 个 的 元 素 上 ， 然 后 再 将 得 到 的 值 加 到 与 它 相 隔 四 个 的 元 素 上 ， 以 此 类 
推 。 如 果 你 以 同样 的 九 个 元 素 开 始 ， 第 一 轮 后 你 得 到 1,3,5,7,9,11,13,15,17， 这 就 
得 到 前 两 个 元 素 最 后 的 值 。 第 二 轮 后 你 得 到 1,3,6,10,14,18,22,26,30， 它 的 前 四 个 
元 素 是 正确 的 。 第 三 轮 后 你 得 到 1,3,6,10,15,21,18,36,44， 它 的 前 八 个 元 素 是 正确 
的 。 第 四 轮 后 你 得 到 1,3,6,10,15,21,18,36,45， 这 就 是 最 终 答 案 。 尺 管 它 比 第 一 种 
方法 的 总 步骤 数 要 多 ， 但 是 如 果 你 有 很 多 线程 的 话 ， 它 有 更 大 的 余地 来 并 行 化 ， 
每 个 处 理 器 每 一 步 都 能 更 新 一 个 入 口 。 


总 的 说 来 ， 第 二 种 方法 执行 logx(N) 个 步 又， 每 一 个 步骤 执行 大 约 N 个 操作 
(每 个 线程 处 理 一 个 ) ， 其 中 N 是 表 中 的 元 素数 量 。 第 一 种 算法 中 ， 每 个 线程 为 
分 配给 它 的 块 的 最 初 分 段 求 和 执行 个 操作 ， 然 后 为 进一步 的 传递 执行 个 操作 
，k 是 线程 数量 。 因 此 从 总 的 操作 数 来 说 ， 第 一 种 方法 是 O(N)， 第 二 种 方法 是 O(N 
log (N))。 尽 管 如 此 ， 如 果 你 的 处 理 器 与 列表 中 的 元 素 一 样 多 ， 那 么 第 二 种 方法 中 
每 个 处 理 器 只 需要 log(N) 个 操作 。 而 当 k 很 大 时 ， 第 一 种 方法 本 质 上 是 捉 行 操作 ， 
因为 需要 进一步 传递 值 。 对 于 拥有 很 少 处 理 单元 的 系统 ， 第 一 种 方法 可 以 更 快 结 
束 ， 而 对 于 大 规模 并 行 系统 ， 第 二 种 方法 可 以 更 快 结束 。8.2.1 节 讨论 了 这 个 问题 
的 一 个 极端 的 例子 。 


qu, 下 论 如 何 ， 先 不 考虑 效率 问题 ， 我 们 来 看 一些 代码 ， 清 单 B11 所 示 的 是 第 一 
方法 ， 


清单 8.11 通过 划分 问题 来 并 行 计 算 分 段 的 和 


template<typename Iterator> 
void parallel partial sum(Iterator first,Iterator last) 


{ 


typedef typename Iterator: :value_type value_type; 


struct process chunk 0 
{ 
void operator ({) (Iterator begin, Iterator last, 
std::future«value type»* previous end value, 


std: :promise<value type»* end value) 


try 


Iterator end-1last; 


++end; 
std::partial_sum{begin, end, begin) ; s 
if(previous end value) 
{ 
value type& addend-previous end value-»get(); 0 
*last+=addend; 
if (end_value) ^e 
{ 
end_value->set_value(*last) ; -© 


} 
std::for_each (begin, last, [addend] (value type& item) <Q 
{ 
n: 
) 


else if(end value) 


{ 


} 
} 
cateht..-) iQ 


item+=addend; 


end value-»set value(*last); EX g] 


if (end_value) 


{ 
} 


else 


{ 
throw; <0 
} 


end value->set_exception{std: :current_exception{)); < 


}; 
unsigned long const length=std::distance(first,last); 


if(!length) 
return last; 


unsigned long const min per threadz25; «p 
unsigned long const max threads- 
(length«min per thread-1)/min per thread; 


unsigned long const hardware threads- 
std::thread::hardware concurrency(); 


unsigned long const num threads- 
std: :min(hardware threads!-0?hardware threads:2,max threads); 


unsigned long const block size-length/num threads; 


typedef typename Iterator::value type value type; 


std: :vector<std::thread> threads (num threads-1); an 13) 
std: :vector<std: :promise<value_type> > 
end values(num threads-1); aD 


std::vector«std::future«value type» > 
previous end values; 

previous end values.reserve (num threads-1); Ex 16 

join threads joiner(threads); 


Iterator block startzfirst; 
for {unsigned long i=0;i< (num_threads-1) ; ++i) 
{ 
Iterator block_last=block_start; 
std: :advance (block_last,block_size-1) ; «A 
threads[i]sstd::thread(process chunk(), co 18) 
block_start,block_last, 
(i!=0) ?&previous_ end values[i-1]:0, 
&end values [i]); 
block_start=block_last; 
++block_start; 
previous end values.push backí(end values[i].get future()); <) 
} 
Iterator final_element=block_start; 
std::advance(final element,std::distance(block start,last)-1); =p 
process chunk() (block_start,final_element, 
(num threads»1)?&previous end values.back():0, 
0); 


在 这 个 例子 中 ， 总 体 结构 与 之 前 的 代码 是 一 样 的 ， 划 分 问题 为 块 ， 每 个 线程 
拥有 最 小 化 的 块 尺 寸 国 。 在 这 种 情况 下 ， 与 线程 向 量 一 样 国 ， 你 有 一 个 promise 向 
量 @@ 用 来 存储 块 中 最 后 一 个 元 素 的 值 ， 并 且 还 有 一 个 future 向 量 候 ， 用 来 得 到 前 一 
个 块 的 最 后 一 个 值 。 你 可 以 保留 fture 的 空间 @ 来 避免 在 生成 线程 的 时 候 再 分 配 ， 
因为 你 知道 将 有 多 少 线程 。 


主 循环 与 以 前 的 一 样 ， 只 是 这 次 你 希望 迭代 器 指 同 每 个 块 中 的 最 后 一 个 元 素 
本 身 ， 而 不 是 通常 情况 下 那样 指向 最 后 元 素 的 后 继 @， 因 此 在 每 个 范围 你 都 可 以 
传递 最 后 一 个 元 素 。 真 正 的 处 理 是 在 process_chunk 函 数 对 象 中 完成 的 ， 我 们 稍 
后 再 分 析 。 需 要 给 的 参数 包括 这 个 块 的 开始 和 结束 的 迭代 器 ， 先 前 范围 的 终 值 
(如 果 存 在 的 话 ) ， 这 个 范围 的 终 值 存放 的 位 置 @。 


产生 线程 后 ， 你 就 可 以 更 新 这 个 块 的 起 点 ， 记 住 将 它 的 值 加 一 使 它 位 于 最 后 
一 个 元 素 之 后 国 ， 并 且 将 当前 块 的 最 后 一 个 值 的 future 存 储 到 future 向 量 中 ， 这 样 
下 一 次 循环 的 时 候 就 可 以 得 到 它 团 。 


在 你 处 理 最 后 一 个 块 之 前 ， 你 需要 得 到 最 后 一 个 元 素 的 欠 代 器 田 ， 这 样 你 就 
可 以 传递 到 process_chunk 中 时。std: :partial_sum 不 返回 值 ， 因 此 一 旦 最 后 
= 八 块 被 处 理 了 ， 你 不 需要 做 任何 操作 。 当 所 有 线程 结束 的 时 候 这 个 操作 就 完成 


现在 我 们 来 看 看 process_chunk 函 数 对 象 在 整个 工作 中 所 起 的 作用 @。 首 先 
在 整个 块 上 调用 std: :partial_ sum， 包括 最 后 一 个 元 素 @， 但 是 然后 就 需要 知 
道 这 是 否 为 第 一 个 块 合 。 如 果 这 不 是 第 一 个 块 ， 那 么 在 先前 块 中 就 
有 previous_end_value， 因 此 你 就 需要 等 待 这 个 值 ![ 序 号 @。 为 了 最 大 化 算法 
的 并 发 性 ， 你 就 需要 首先 更 新 最 后 一 个 元 素 上 加， 因此 你 将 值 传 递 给 下 一 个 块 〈 如 
果 存 在 的 话 ) @。 一 旦 完成 了 这 些 操作 ， 你 就 可 以 使 用 std: :for_each 和 一 个 简 
单 的 lambda 函 数 @ 来 更 新 这 个 范围 内 剩 下 的 元 素 。 


如 果 没 有 previous_end_value， 那 么 这 就 是 第 一 个 块 ， 因 此 你 可 以 只 更 新 
下 一 个 块 的 end_value()〔 同 样 ， 如 果 存 在 下 一 个 块 的 话 一 一 这 可 能 是 仅 有 的 
Bog. 


最 后 ， 如 果 任 何 操作 抛 出 异常 ， 你 捕捉 到 它 提 并 且 将 它 存储 在 promise 中 办 。 
这 样 当 它 试图 得 到 先前 的 最 后 一 个 值 的 时 候 就 会 传递 给 下 一 个 块 了 @。 这 会 将 所 
有 的 异常 都 传递 给 最 后 一 个 块 ， 然 后 被 重新 抛 出 @， 因 为 你 知道 这 是 运行 在 主线 


程 上 


因为 线程 间 的 同步 ， 这 段 代码 就 不 容易 控制 与 std: :async 一 起 重 写 。 等 待 
结果 的 任务 中 途 通 过 别 的 任务 的 执行 ， 因 此 所 有 任务 都 必须 同时 运行 。 


使 用 基于 块 ， 向 前 传输 的 方法 是 很 少见 的 ， 让 我 们 来 看 看 计算 范围 内 部 分 和 
的 第 二 种 方法 。 


为 部 分 求 和 实现 增 量 对 偶 算 法 


当 你 的 处 理 器 可 以 按部就班 地 执行 加 法 ， 通 过 累加 越 来 越 远 的 元 素来 计算 部 
分 和 的 方法 可 以 工作 得 很 好 。 在 这 种 情况 下 ， 不 需要 进一步 的 同步 ， 因 为 所 有 中 
间 结 果 都 会 直接 传递 给 下 一 个 需要 它们 的 处 理 器 。 但 是 实际 上 ， 你 很 少 可 以 在 这 
样 的 系统 上 工作 ， 除 非 你 的 系统 文 持 少量 数据 元 素 上 同时 执行 操作 的 指令 ， 即 所 
谓 的 单 指令 /多 数据 〈Single-Instruction/Multiple-Data，SIMD) 指 令 。 因 此 ， 你 必须 
为 通常 情况 设计 代码 并 且 每 一 步 都 明确 地 同步 线程 。 


一 种 方法 是 使 用 屏障 (barrier) 一 种 同步 方法 使 得 线程 等 待 直到 要 求 的 
线程 已 经 到 达 了 屏障 。 一 旦 所 有 线程 到 达 屏 障 ， 它 们 就 可 以 继续 执行 而 不 阻 紧 
了 。C++11 线 程 库 没有 直接 提供 这 样 的 工具 ， 因 此 你 需要 自己 设计 。 


想象 一 下 游乐 园 里 的 过 山 车 。 如 果 有 合适 数量 的 人 在 等 待 ， 游 乐园 职员 就 会 
确保 在 过 山 车 离开 平台 之 前 每 个 座位 都 有 人 。 屏 障 的 工作 原理 也 是 一 样 的 ， 你 提 
前 指定 “座位 ”的 数量 ， 并 且 线 程 必须 等 待 直到 所 有 “座位 ”都 是 满 的。 一 旦 有 足够 
的 等 待 线程 ， 就 可 以 继续 执行 ， 屏障 被 重 置 并 且 开 始 等 待 下 一 批 线程 。 通 常 ， 在 
循环 中 使 用 此 构造 ， 在 那里 同一 线程 再 次 出 现 并 且 等 待 下 一 次 。 这 个 想法 是 为 了 
使 线程 按部就班 地 工作 ， 因 此 一 个 线程 不 会 在 别 的 线程 前 面 离开 以 及 掉队 。 对 于 
这 个 算法 ， 这 就 会 造成 灾难 ， 因 为 离开 的 线程 可 能 会 修改 别 的 线程 正在 使 用 的 数 
据 ， 或 者 使 用 还 没有 被 正确 更 新 的 数据 。 


无 论 如 何 ， 清 单 8.12 给 出 了 屏障 的 一 个 简单 实现 。 


清单 8.12 一 个 简单 的 屏障 类 


class barrier 
unsigned const count; 
std::atomic<unsigned> spaces; 
std::atomic<unsigned> generation; 


public: m 
explicit barrier(unsigned count ): 
count (count ),spaces(count) , generation (0) 
{} 
void wait () 
{ 


unsigned const my_generation=generation; -© 


if (!--spaces) 
| P 


spaces-count; «O0 


++generation; «9 
) 
else 
{ 
while (generation==my_ generation) iQ 
std: :this thread: :yield() ; a € 
) 


在 这 个 实现 中 ， 你 构造 了 一 个 barrier， 它 具有 一 定数 量 “ 座 位 ”"@， 存 储 
在 count 变 量 中 。 最 初 ， 屏 障 中 spaces 的 数量 与 count 相 等 。 当 每 个 线程 等 待 的 
时 候 ，spaces 的 数量 就 会 减 1 人 @。 当 它 的 值 为 零 的 时 候 ，spaces 的 值 就 会 重 置 
为 count@@， 并 有 日 generation 的 值 增 一 来 给 别 的 线程 发 信号 表示 它们 可 以 继续 执 
行 @。 如 果 空 间 spaces 的 数量 没有 达到 零 ， 你 就 必须 等 待 。 这 个 实现 使 用 一 种 简 
单 旋转 锁 @， 检 查 在 wait( ) 开 始 的 时 候 得 到 的 值 。 因 为 当 所 有 线程 到 达 屏 障 的 时 
候 才 会 更 新 generation 的 值 @， 等 待 的 时 候 调 用 yield()@， 因 此 在 一 个 繁忙 的 
等 待 中 ， 等 待 的 线程 不 会 独占 CPU。 


当 我 说 这 个 实现 是 简单 的 ， 我 的 意思 是 它 使 用 一 个 旋转 锁 ， 因 此 它 不 适合 线 
程 可 能 等 待 很 长 时 间 的 情况 。 并 且 如 果 在 任何 一 个 时 间 有 多 于 count 数 量 的 线程 
可 能 调用 wait()， 那 么 它 就 不 起 作用 了 。 如 果 你 想 处 理 这 些 情况 中 的 任何 一 种 ， 
你 就 必须 使 用 一 个 更 健壮 性 《但 是 更 复杂 ) 的 实现 来 代替 。 我 遵循 了 在 原子 变量 
上 的 顺序 连续 操作 ， 因 为 这 使 得 事情 更 容易 解释 ， 但 是 你 可 以 放松 一 些 顺 序 约 
束 。 在 大 规模 并 发 结构 上 ， 这 样 的 全 局 同步 是 代价 很 高 的 ， 因 为 缓存 线 持 有 屏障 
的 状态 必须 在 所 有 涉及 到 的 线程 间 穿 梭 (参见 8.2.2 市 )， 因 此 你 必须 注意 确保 在 
这 里 这 是 最 好 的 选择 。 


无 论 如 何 ， 在 这 里 这 惑 是 你 所 需要 的 ， 你 有 固定 数量 的 线程 在 循规蹈矩 的 循 
环 中 和 运行。 当然， 这 只 是 几乎 固定 数量 的 线程 。 你 可 能 记得 ， 在 一 些 步骤 后 ， 列 
表 开 始 的 项 获得 它 的 最 终 值 。 这 就 意味 着 要 么 你 保持 这 些 线程 循环 直到 处 理 完 整 
个 范围 ， 要 么 你 需要 允许 屏障 处 理 线程 退出 并 且 减 少 count 。 我 倾 问 于 后 面 一 种 
选择 ， 因 为 它 避 免 了 使 线程 只 是 循环 而 不 做 任何 有 用 的 工作 直到 最 后 一 步 完 成 。 


这 就 意味 着 你 需要 将 count 变 成 一 个 原子 变量 ， 因 此 你 可 以 从 多 个 线程 更 新 
它 而 不 需要 额外 的 同步 。 


std: :atomic<unsigned> count; 


它 的 初始 化 是 一 样 的 ， 但 是 现在 当 你 重 置 spaces 的 值 的 时 候 就 必须 明确 
在 count 中 load()。 


spaces-count.load(); 


这 些 都 是 在 wait() 上 所 做 的 改变 ;现在 你 需要 一 个 新 的 成 员 函 数 来 减 
少 count 。 我 们 称 之 为 done_waiting()， 因 为 一 个 线程 声称 在 等 待 的 时 候 完 成 


I 


Kio 


void done waiting () 


{ 
--count; +@ 
if (!--spaces)} c 
{ 
spaces=count.load(} ; «9 
++generation; 
j 
j 


你 做 的 第 一 件 事 是 递减 count 的 值 @， 这 样 下 一 次 重 置 spaces 就 反映 新 的 等 
待 线 程 的 数量 。 然 后 你 需要 将 空 闪 spaces 的 数目 递减 @。 如 果 不 这 么 做 ， 别 的 线 
程 就 会 永远 等 待 ， 因 为 spaces 被 初始 化 为 旧 的 ， 更 大 的 值 。 如 果 这 是 分 文 上 的 最 
后 一 个 线程 ， 你 就 需要 重 置 counter 并 且 增 加 generation@， 就 如 你 在 wait() 
中 所 做 的 那样 。 在 完成 所 有 的 等 待 后 就 结束 了 。 


现在 你 准备 好 写 部 分 和 的 第 二 种 实现 了 。 在 每 一 步 ， 每 个 线程 在 屏障 上 调 
用 wait() 来 保证 线程 步骤 一 起 ， 并 且 一 旦 每 个 线程 都 完成 了 ， 就 在 屏障 上 调 
用 done_waiting() 来 减少 count。 如 果 你 在 初始 范围 内 使 用 第 二 个 缓冲 如 ， 屏 隐 
提供 你 所 需要 的 所 有 同步 。 在 每 一 步 中 ， 线 程 从 原先 的 范围 或 者 缓冲 器 中 读 取 ， 
并 且 将 新 值 写 入 相关 元 素 中 。 如 果 线 程 在 一 个 步骤 中 读 取 了 原先 的 范围 ， 它 们 在 
下 一 个 步骤 中 读 取 缓冲 器 ， 反 之 亦 然 。 这 惑 确保 了 在 不 同 线程 的 读 取 和 写 操作 中 


没有 竞争 条 件 。 一 旦 一 个 线程 结束 循环 ， 它 必须 确保 正确 的 最 终 值 被 写 入 最 初 的 
范围 中 。 清 单 8.13 给 出 了 所 有 的 操作 。 
清单 8.13 ”通过 成 对 更 新 的 partial_sum 的 并 行 实现 


struct barrier 


std: :atomic<unsigned> count; 
std: :atomic<unsigned> spaces; 
std: :atomic<unsigned> generation; 


barrier(unsigned count ): 
count (count ),spaces(count ),generation(0) 
{} 


void wait () 

{ 
unsigned const gen=generation.load(); 
if (!--spaces) 


{ 


Spaces-count.load(); 


++generation; 

} 

else 

{ 
while (generation.load({) ==gen) 
{ 


std::this thread: :yield(); 


} 
} 


void done waiting() 


{ 


--count; 
if(!--spaces) 


{ 


spaces-count.load(); 
*-generation; 


); 


template<typename Iterator> 
void parallel_partial_sum(Iterator first,Iterator last) 


{ 
typedef typename Iterator: :Value type value_type; 
struct process_element 20 


void operator({} (Iterator first,Iterator last, 
std: :vector<value_type>& buffer, 
unsigned i,barrier& b) 


value type& ith element-*(firstsi); 
bool update source-false; 


for(unsigned step=0,stride=1;stride<=i;++step, stride*=2) 


{ 
value type const& source- (step$2)? -+ 
buffer [i] ;ith element; 
value type& dest- (step$2)? 
ith element:buffer[il; 
value type const& addend- (step$2)? -© 
buffer[i-stride]:*(first«i-stride); 
dest=source+addend; «o 
update source-! (step%2) ; 
b.wait(); -© 
} 
if(update source) QO 
{ 
ith_element=buffer [i]; 
} 


b.done_waiting(); +@ 


unsigned long const length=std: :distance(first,last) ; 


if (length<=1) 
return; 


Std::vector«value type» buffer (length); 
barrier b(length); 


std: : vector<std::thread> threads (length-1) ; 509 
join threads joiner (threads); 


Iterator block start-first; 
for (unsigned long i=0;i< (length-1) ;++i) 
{ 
threads [i] =std::thread(process_element (),first,last, —9 
Std::ref(buffer),i,std::ref(b)); 
} 


process element (} (first, last, buffer, length-1,b) ; < 


现在 你 已 经 很 熟悉 这 段 代 码 的 总 体 结构 了 。 你 用 一 个 拥有 函数 调用 操作 的 类 
(process element) 来 做 这 个 工作 @， 你 在 存储 在 向 量 中 全 的 一 些 线程 @ 上 运 
行 它 并 且 在 主线 程 调用 它 侈 。 这 次 的 主要 不 同 之 处 在 于 线程 数量 取决 于 列表 中 项 
的 数量 而 不 是 取决 于 std: :thread: :hardware_concurrency。 正 如 我 所 说 ， 除 
非 你 是 在 一 个 线程 很 便宜 的 大 量 并 行 机 器 上 运行 ， 这 不 是 一 个 好 方法 ， 但 是 它 显 
示 了 总 体 结构 。 也 可 以 用 较 少 的 线程 ， 每 个 线程 处 理 源 范围 的 多 个 值 。 但 是 这 也 
会 出 现 一 个 问题 ， 那 就 是 有 足够 少 的 线程 使 得 它 比 向 前 传输 算法 的 效率 还 要 低 。 


无 论 如 何 ， 在 process_element 函 数 调用 操作 中 完成 了 关键 工作 。 每 一 步 你 
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到 stride 元 素 的 值 中 合 ， 如 果 从 原先 的 范围 开始 就 将 它 存储 在 缓冲 器 中 ， 或 者 如 
果 从 缓冲 器 开始 就 存储 在 原先 的 范围 中 四。 然后 在 开始 下 一 步 之 前 你 在 屏障 上 等 
待 @。 当 stride 使 你 离开 范围 的 起 点 时 你 就 完成 操作 了 。 在 这 种 情况 下 ， 如 果 你 
的 最 终结 果 存 储 在 缓冲 器 中 的 话 ， 就 更 新 原先 范围 里 的 元 素 @。 最后， 你 告诉 屏 
障 你 正在 done_waiting()@. 


注意 这 种 情况 不 是 异常 安全 的 。 如 果 一 个 工作 线程 在 process_element 上 抛 
出 异常 ， 就 会 终止 此 引用 。 你 可 以 使 用 std: :promise 存 储 异常 来 处 理 这 种 情 
况 ， 正 如 你 在 清单 8.9 的 parallel_find 实 现 中 所 做 的 一 样 ， 或 者 使 用 互 斥 元 保护 
的 std: :exception_ptr。 


这 总 结 了 我 们 的 三 个 例子 ， 和 希望 它们 有 助 于 具体 化 8.1，8.2 和 8.3 中 强调 的 设 
计 考 虑 ， 并 且 证 明 在 真实 代码 中 可 以 使 用 这 些 方法 。 


8.6 总结 


本 章 我 们 涉及 很 多 基础 知识 。 我 们 从 在 线程 间 划 分 工作 的 多 种 方法 开始 ， 如 
提前 划分 数据 或 者 使 用 许多 线程 来 形成 管道 。 然 后 我 们 从 低 水 平角 度 考 虑 与 多 线 
程 代码 的 性 能 紧密 相关 的 问题 ， 在 转移 到 数据 读 取 是 如 何 影响 代码 性 能 之 前 考虑 
了 假 共 部 和 数据 竞争 问题 。 然 后 我 们 考虑 了 设计 并 发 代码 时 候 要 考虑 的 问题 ， 如 
异常 安全 和 可 扩展 性 。 最 后 ， 我 们 以 一 些 并 发 算法 实现 的 例子 作为 结束 ， 每 一 个 
例子 都 强调 了 当 设 计 多 线程 代码 时 可 能 出 现 的 具体 问题 。 


本 章 出 现 几 次 的 一 个 事情 就 是 线程 池 的 想法 一 一 一 组 事先 配置 的 线程 运行 分 
配给 线程 池 的 任务 。 很 多 想法 被 用 在 设计 一 个 好 的 线程 池上 ， 因 此 下 一 章 我 们 将 
考虑 一 些 问 题 ， 以 及 高 级 线程 管理 的 别 的 方面 。 


[1] http://www.mpi-forum.org/ 
[2] http://www.openmp.org/ 
[3] http://setiathome.ssl.berkeley.edu/ 


[4] http://threadingbuildingblocks.org/ 
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在 之 前 的 章节 中 ， 我 们 通过 为 每 个 线程 创建 std: :thread 对 象 来 显 式 管理 线 
程 。 在 一 些 应 用 场合 ， 你 会 发 现 这 不 是 你 所 需要 的 ， 因 为 你 必须 管理 线程 对 象 的 
生命 周期 ， 决 定 适合 问题 和 硬件 的 线程 数量 等 。 一 个 理想 的 方案 是 ， 你 只 需要 将 
代码 划分 可 以 被 并 发 执行 的 在 干 小 片 ， 将 他 们 传递 给 编译 器 和 运行 库 ， 然 后 告诉 


编译 器 < 并行 化 这 些 代码 来 得 到 较 优 的 性 能 "。 


另外 一 个 反复 出 现 的 场景 是 你 可 能 使 用 几 个 线程 来 求解 一 个 问题 ， 但 是 要 求 
它们 在 满足 一 定 条 件 的 时 候 提前 结束 。 这 有 可 能 是 因为 结果 已 经 被 求解 出 来 ， 或 


者 因为 有 错误 发 生 ， 甚 至 是 因为 用 户 显 式 要 求 操作 被 放弃 。 不 管 什 么 原因 ， 
需要 被 发 送 “ 请 停止 >” 信号， 这 样 它 们 可 以 放弃 赋予 它们 的 任务 ， 尽 快 的 清理 
的 环境 ， 然 后 停止 运行 。 


在 本 章 中 ， 我 们 会 从 自动 管理 线程 数量 和 线程 之 间 的 任务 划分 开始 介绍 管理 


线程 和 任务 的 机 制 。 


线程 
自己 


9.1 线程 池 


在 许多 公司 ， 员 工 通 常 在 办 公 室 上 班 。 但 是 有 时 候 员 工 需要 出 差 去 访问 客户 
或 者 供应 商 ， 参 加 一 个 交易 展览 或 者 会 议 。 虽 然 这 些 出 差 是 必须 的 ， 并 且 在 茶 些 
天 有 好 几 个 人 同时 需要 出 着 ， 但 是 对 于 有 具体 茶 个 员工 来 说 ， 不 同 出 差 的 时 间 间 隔 
可 能 是 几 个 月 甚至 几 年 。 为 每 个 员工 都 配置 一 辆 车 是 非常 昂贵 的 或 者 不 切实 际 
的 ， 因 此 公司 通常 都 提供 一 个 汽车 池 。 汽 车 池 有 一 定数 量 的 汽车 ， 供 公司 的 所 有 
员工 出 差 使 用 。 当 公司 的 员工 需要 出 差 时 ， 他 们 在 合适 的 时 间 向 汽车 池 申 请 一 辆 
汽车 。 当 出 差 回来 的 时 候 ， 员 工 将 汽车 归还 给 汽车 池 。 如 果 汽 车 池 中 没有 可 用 的 
汽车 ， 员 工 需要 重新 规划 自己 出 差 的 行程 。 


线程 池 是 一 个 类 似 的 思想 ， 不 过 其 中 共享 的 是 线程 而 不 是 汽车 。 在 大 多 数 系 
统 上 面 ， 为 每 个 可 以 与 其 他 任务 并 行 执 行 的 任务 分 配 一 个 单独 的 线程 是 不 切实 际 
的 。 但 是 可 以 尽量 充分 利用 硬件 提供 的 并 发 性 。 线 程 池 允许 你 利用 这 一 点 。 可 以 
被 并 发 执行 的 任务 被 提交 到 线程 池 中 ， 在 线程 池 中 被 放 入 一 个 等 等 队列 。 每 个 任 
务 会 被 茶 个 工作 线程 从 等 每 队 中 取出 来 执行 。 工 作 线程 的 任务 就 是 当空 的 时 候 
从 等 待 队 中 取出 任务 来 执行 。 


建立 一 个 线程 池 有 几 个 关键 设计 问题 ， 比 如 在 线程 池 中 创建 几 个 工作 线程 ， 
将 任务 高 效 分 配给 工作 线程 的 方法 以 及 是 否 可 以 等 待 某 个 任务 的 完成 等 。 在 这 个 
小 节 中 ， 我 们 会 提出 一 些 实现 来 解决 这 些 问题 ， 我 们 将 从 最 简单 的 线程 池 开 始 。 


9.1.1 最 简单 的 线程 池 


线程 池 最 简单 的 形式 是 含有 一 个 固定 数量 的 工作 线程 (典型 的 数量 
是 std: :thread: :hardware_concurrency() 的 返回 值 ) 来 处 理 任务 。 当 有 任务 
要 处 理 的 时 候 ， 调 用 一 个 函数 将 任务 放 到 等 待 队 列 中 。 每 个 工作 线程 都 是 从 该 队 
列 中 取出 任务 ， 执 行 完 任务 之 后 继续 从 等 待 队列 取出 更 多 的 任务 来 处 理 。 在 最 简 
单 的 情况 ， 没 有 办 法 来 等 待 一 个 任务 完成 。 如 果 需 要 有 这 样 的 功能 ， 则 需要 用 户 
自己 维护 同步 。 


清单 9.1 给 出 了 一 个 最 简单 的 线程 池 的 示例 实现 。 


清单 9.1 简单 的 线程 池 


class thread_pool 


{ 


std::atomic_bool done; 


thread safe queue<std: :function<void()> > work queue; «9 
Std::vector«std::thread» threads; «e 
join threads joiner; —.9 


void worker thread() 


{ 
while (!done) «0 
{ 


std::function<void()> task; 


if (work_queue.try_pop (task) ) «— 
{ 
task () ; 0 
} 
else 
{ 
std::this thread: :yield(); —9 


) 
} 


public: 
thread pool(0): 
done (false) , joiner (threads) 


{ 


unsigned const E AEEA A D EE N EIEE EE E EE. 


Dry 


{ 


for (unsigned i=0;i<thread_count;++i) 


{ 


threads .push_back ( 


std: :thread (&thread_ pool: :worker thread,this)); + 
} 
} 
catch(...) 
{ 
done=true; «D 
throw; 
} 
} 
~thread_pool () 


{ 
} 


template<typename FunctionType> 
void submit (FunctionType f) 


{ 
} 


done=true; ER 


work queue.push(std::function<void() >(£)); «p 


m 


这 个 实现 使 用 一 个 向 量 来 保存 工作 线程 @@， 使 用 一 个 第 6 章 中 线程 安全 的 队 
列 @ 来 管理 待 处 理 的 任务 。 在 这 个 实现 中 ， 用 户 不 能 等 待 任务 ， 也 不 能 返回 任何 
值 。 所 以 你 可 以 使 用 std: :function<void()> 来 封装 你 的 任务 。 函 数 submit() 
将 任何 函数 或 者 能 够 调用 的 对 象 包装 成 为 std: :function<void()> 实 例 ， 然 后 
放 到 队列 中 人 @。 


工作 线程 是 在 构造 器 中 创建 的 ， 用 户 使 
用 std: :thread: :hardware_concurrency() 来 告诉 用 户 硬 件 支持 的 并 发 线程 数 
量 合 ， 人 然后 创建 同样 数量 的 线程 来 执行 worker_thread() 成 员 函 数 。 


创建 一 个 线程 可 能 会 失败 ， 然 后 抛 出 一 个 异常 ， 所 以 你 需要 保证 你 已 经 创建 
的 任何 线程 都 能 够 非常 合适 的 停止 并 且 清 理 掉 。 这 个 功能 是 通过 一 个 try-catch 
块 来 完成 的 。 当 异常 出 现 的 时 候 设 置 done 标 志 @， 在 男 外 一 边 第 8 章 的 
join_threads 合 的 一 个 实例 被 用 来 等 待 所 有 工作 线程 的 结束 。 这 也 可 以 在 析 构 
函数 中 完成 ， 只 要 设置 done 标 志 @@，join threads 实 例会 保证 在 线程 池 被 销毁 
前 所 有 线程 已 经 完成 。 注 意 成 员 变 量 声明 的 顺序 是 重要 的 ，done 标 志 跟 
work_queue 必 须 声 明 在 threads 辣 量 前 面 ，threads 辣 量 必须 声明 在 joiner 前 
面 。 这 个 顺序 保证 所 有 成 员 会 被 正确 的 销毁 掉 。 例 如 ， 在 所 有 线程 停止 之 前 工作 
线程 队列 不 能 被 安全 的 销毁 。 


函数 worker_thread 的 实现 非常 简单 。 它 包含 一 个 循环 等 待 直到 done 标 志和 三 
设置 @， 不 停 的 从 队列 中 取出 任务 @， 然 后 执行 它们 @。 如 果 队 列 中 没有 任务 ， 
它 会 调用 std: :this_thread: :yield() 和 暂停 一 小 段 时 间 @， 在 下 次 执行 前 给 其 
他 线程 一 个 机 会 往 队 列 中 添加 任务 。 


在 许多 情况 下 ， 这 样 一 个 简单 的 线程 池 是 足够 用 了 ， 特 别 是 如 果 所 有 任务 是 
完全 独立 的 并 且 不 返回 任何 值 或 者 执行 一 些 阻塞 的 操作 。 但 是 存在 许多 简单 线程 
池 无 法 满足 用 户 需求 的 情况 ， 在 这 些 情况 下 可 能 会 引起 一 些 问题 ， 比 如 死 锁 。 在 
简单 情况 下 ， 用 户 像 第 8 章 的 例子 一 样 使 用 std: :async 可 能 会 得 到 更 好 的 解决 办 
法 。 在 本 章 中 ， 我 们 会 使 用 一 些 更 加 复杂 的 线程 池 实 现 来 提供 额外 的 特征 来 解决 
用 户 需 要 的 或 者 减少 潜在 的 问题 。 首 先是 等 待 一 个 我 们 提交 的 任务 。 


9.1.2 等待 提交 给 线程 池 的 任务 


第 8 章 的 例子 都 是 显 式 的 创建 线程 。 在 划分 任务 给 线程 后 ， 主 线程 总 是 等 待 
创建 的 线程 结束 来 保证 在 返回 给 调用 者 之 前 所 有 任务 都 已 经 完成 了 。 使 用 线程 池 
之 后 ， 你 需要 等 待 提交 到 线程 池 的 任务 结束 ， 而 不 是 等 待 工作 线程 。 这 一 点 跟 第 
8 章 中 基于 std: :async 的 例子 有 点 相似 。 但 是 在 清单 9.1 实 现 的 线程 池 中 ， 你 必须 
人 为 的 使 用 第 4 章 中 的 条 件 变量 等 来 实现 这 一 点 。 这 会 增加 代码 的 复杂 性 。 如 果 
能 够 直接 等 待 任务 结束 会 更 好 。 


通过 将 复杂 度 移 到 线程 池 中 ， 可 以 直接 等 竺 任务 的 结束 。 可 以 让 submit( ) 函 
数 返 回 一 个 任务 句柄 ， 利 用 这 个 句柄 可 以 等 竺 任务 结束 。 这 个 任务 句柄 包装 了 条 
件 变量 或 者 其 他 来 简化 使 用 线程 池 的 代码 。 


作为 一 个 特别 的 例子 ， 当 主线 程 需 要 任务 计算 的 结果 的 时 候 ， 主 线程 不 得 不 
等 待 任务 的 结束 。 这 样 的 例子 一 直 在 本 书 中 出 现 ， 比 如 第 2 章 的 
parallel_accumulate 函 数 。 在 这 个 例子 中 ， 你 可 以 通过 使 用 std: :future 来 
等 待 线程 的 结束 ， 然 后 组 合 每 个 线程 的 结果 。 清 单 9.2 展 示 了 人 允许 你 等 待 任务 结 
和 传递 返回 值 到 等 待 的 线程 需要 对 简单 线程 池 做 的 修改 。 

为 std: :packaged_task<> 的 实例 只 是 可 移动 的 ， 而 不 是 可 复制 的 ， 不 再 能 够 

用 std: :function<> 来 作为 队列 中 的 元 素 ， 因 为 std: :function<> 要 求 存 储 的 
函数 对 象 是 可 以 拷贝 和 构造 的 。 因 此 ， 必 须 使 用 一 个 定制 的 函数 包装 来 处 理 只 能 
移动 的 类 型 。 这 是 一 个 简单 的 带 有 一 个 调用 操作 符 的 类 。 因 为 只 需要 处 理 不 带 有 
参数 并 且 返 回 void 的 函数 ， 所 以 用 了 很 直观 的 虚 调 用 来 实现 。 


清单 9.2 有 等 待 任务 的 线程 池 


class function_wrapper 
{ 
struct impl_base { 
virtual void call()=0; 
virtual -impl base() () 
}; 
std::unique_ptr<impl_base> impl; 
template<typename F> 
struct impl type: impl base 
( 
F f; 
impl type(F&& f ): f(std::move(£ )) () 
void call() ( £0; ) 
) 
public: 
template<typename F> 
function wrapper (F&& f): 
impl (new impl type«F»(std::move(f))) 
{} 


void operator()() ( impl-»call(); } 
function wrapper() = default; 


function wrapper(function wrapper&& other): 
impl (std: :move (other.imp1) ) 
{} 


function wrapper& operator=(function_wrapper&& other) 


{ 
impl=std: :move (other.imp1) ; 
return *this; 


} 


function wrapper(const function wrapper&)-delete; 


function wrapper(function wrapper&)-delete; 


function wrapper& operators (const function wrapper&)zsdelete; 


h 
class thread pool 
( 


thread safe queue-function wrapper» work queue; 


void worker thread() 


( 


while (!done) 


{ 


function_wrapper task; 


使 用 函数 包装 器 而 非 


if (work_queue.try_pop (task) ) 


task () ; 


} 


else 


std: :this_thread::yield() ; 
} 
} 
public: 
template<typename FunctionType> 
std: :future<typename std: :result_of<FunctionType()>::type> +0 
submit (FunctionType f) 
{ 


typedef typename std::result_of<FunctionType ()>::type 


result_type; +@ 
std: :packaged_task<result_type()> task (std: :move(f)) ; 9 
std::future«result type» res(task.get future()); < 
work_queue.push (std: :move (task) ) ; < 


return res; 


) 
J 


// rest as before 


首先 ， 修 改 后 的 submit() 函 数 @ 返 回 一 个 std: :future<> 对 象 来 保存 任务 
的 返回 值 和 人 允许 调用 者 等 待 任务 结束 。 这 要 求 你 知道 任务 函数 {的 返回 值 ， 其 值 
为 std: :result_of<>， 这 个 值 来 自 于 
std: :result_of<FunctionType()>::type， 这 个 值 是 不 带 参 数 地 调 
用 FunctionType 《如 f) 的 返回 值 。 通 过 使 用 typedef 来 将 同样 的 
std::result ofc XX Xt 7jresult type). 


然后 将 函数 f 包 装 在 一 个 std: :packaged_ task«result type()»'6. 
为 f 是 一 个 返回 值 类 型 为 result_type 并 且 没 有 参数 的 函数 或 者 可 以 调用 的 对 
象 ， 正 如 我 们 推导 的 一 样 。 你 可 以 在 将 任务 加 入 到 等 待 队 列 之 前 @ 通 过 
std: :packaged_task<> 得 到 一 个 future 对 象 人 @， 然 后 返回 这 个 future 对 象 @。 注 
意 你 必须 使 用 std: :move( ) 来 将 任务 加 入 到 等 待 队列 中 ， 因 为 std:: 
packaged_task<> 不 是 可 以 拷贝 的 。 为 了 处 理 这 个 特性 ， 等 等 队列 中 现在 存储 的 
是 function_wrapper 对 象 ， 而 不 是 std: :function<void()> 队 列 。 


这 个 线程 池 的 实现 允许 你 等 待 你 的 任务 结束 以 及 得 到 任务 的 返回 值 。 清 单 9.3 
展示 了 使 用 这 个 线程 池 来 实现 parallel_accumulate 函 数 。 


清单 9.3 ”使 用 可 等 待 任务 线程 池 的 parallel_accumulate 


template<typename Iterator,typename T> 
T parallel accumulate (Iterator first,Iterator last,T init) 
{ 


unsigned long const length=std::distance (first, last) ; 


if (!length) 
return init; 


unsigned long const block_size=25; 
unsigned long const num blocks- (length«block size-1)/block size; 0 


std: :vector<std::future<T> > futures (num_blocks-1) ; 
thread pool pool; 


Iterator block start-first; 
for {unsigned long i=0;i< (num_blocks-1) ;++1) 


Iterator block end-block start; 
std: :advance (block end,block size); 
futures [i] =pool.submit (accumulate block«Iterator,T»()); «e 
block start-zblock end; 
) 
T last result-accumulate block«Iterator,T»() (block start,last); 
T result-init; 
for (unsigned long i=0;1i<(num_blocks-1) ;++1) 


{ 
} 


result += last_result; 
return result; 


result+=futures [i] .get(); 


当 你 将 清单 9.3 的 代码 跟 清 单 8.4 的 代码 比较 的 时 候 ， 存 在 几 个 地 方 需要 注意 
的 。 首 先 ， 你 是 跟 数 据 块 的 数量 Cnum_blocks@) 打交道 ， 而 不 是 多 少 个 线 
程 。 为 了 能 够 充分 使 用 线程 池 的 扩展 性 ， 需 要 将 任务 划分 为 最 小 的 值得 并 行 的 
块 。 当 线程 池 中 只 有 少量 线程 时 ， 每 个 线程 需要 处 理 许多 数据 块 。 但 是 当 线 程 数 
量 随 着 硬件 的 发 展 而 增长 时 ， 被 并 发 处 理 的 数据 块 也 增长 。 


你 需要 谍 慎 选择 “最 小 的 值得 并 行 处 理 的 块 "。 每 个 提交 到 等 待 队列 中 的 子 任 
务 需 要 有 一 定 的 开销 。 这 些 开销 包括 提交 到 等 竺 队列 的 开销 ， 由 工作 线程 去 执行 
任务 的 额外 开销 ， 将 结果 通过 std: :future<> 返 回 给 调用 线程 的 开销 。 如 果 选 择 
的 块 太 小 ， 在 线程 池 中 执行 的 速度 可 能 比 使 用 单线 程 的 速度 还 要 慢 。 


假定 块 的 大 小 是 合适 的 ， 你 不 需要 担心 打包 任务 ， 获 得 future 或 者 存储 
std: :thread 以 供 后 面 等 待 线程 结束 使 用 。 线 程 池 会 处 理 这 些 细节 。 所 有 你 需要 
做 的 只 是 调用 submit() 来 提交 你 的 任务 @。 


线程 池 也 处 理 异常 的 安全 事宜 等 。 任 何 由 任务 抛 出 的 异常 会 被 传递 
到 submit() 返 回 的 future 中 。 如 果 函 数 带 着 异常 退出 ， 线 程 池 会 丢弃 掉 还 没有 完 


成 的 任务 然后 等 待 线程 池 中 的 线程 结果 。 


这 个 线程 池 在 针对 每 个 任务 都 是 独立 的 时 候 工 作 得 非常 好 。 但 是 当 任 务 之 间 
有 依赖 关系 的 时 候 ， 这 个 线程 池 就 不 能 很 好 地 工作 了 。 


9.1.3 ”等 每 其 他 任务 的 任务 


在 本 书 中 ， 我 们 一 直 使 用 快速 排序 算法 作为 例子 。 快 速 排序 的 原理 非常 简 
单 ， 给 定 一 个 哨兵 元 素 ， 数 据 被 划分 为 两 个 序列 ， 一 个 序列 的 元 素 都 在 哨兵 元 素 
之 前 ， 另 外 一 个 序列 是 在 哨兵 元 素 之 后 。 然 后 利用 递归 将 两 个 序列 排序 ， 将 两 个 
子 序列 的 结果 连接 起 来 得 到 排序 的 最 终结 果 。 在 并 行 化 这 个 算法 时 ， 你 需要 保证 
这 些 递归 调用 能 够 充分 利用 可 用 的 并 行 性 。 


回顾 第 4 章 ， 当 我 首次 介绍 这 个 例子 的 时 候 ， 我 们 使 用 std: :async 来 运行 其 
中 的 一 个 递归 调用 ， 让 库 来 选择 是 使 用 一 个 新 的 线程 来 执行 它 还 是 当 有 关 的 
get () 被 调用 时 来 异步 执行 它 。 这 种 方式 能 够 很 好 地 工作 ， 因 为 每 个 任务 或 者 是 
在 自己 的 线程 上 执行 ， 或 者 是 当 需 要 的 时 候 会 被 调用 。 


在 第 8 章 当 我 们 重新 审视 快速 排序 的 实现 时 ， 你 看 到 一 个 不 同 的 结构 。 在 那 
里 我 们 使 用 一 组 固定 数目 的 线程 。 在 这 种 情况 下 ， 我 们 使 用 一 个 栈 来 保存 需要 排 
序 的 序列 。 因 为 每 个 线程 将 它 正在 排序 的 数据 进行 划分 ， 它 将 一 个 新 的 数据 块 放 
到 栈 上 ， 对 男 外 一 个 数据 集 直接 进行 排序 。 在 这 个 做 法 中 ， 直 观 的 等 待 其 他 块 结 
束 可 能 会 死 锁 ， 因 为 你 在 使 用 一 个 线程 来 等 待 。 很 容易 会 出 现 所 有 线程 都 是 在 等 
符 某 个 数据 块 被 排序 ， 没 有 一 个 线程 在 执行 实际 的 排序 过 程 。 我 们 通过 让 线程 在 
等 待 某 个 未 排序 的 数据 块 的 时 候 从 栈 上 拿 出 一 个 待 处理 的 数据 来 排序 来 解决 这 个 


问题 。 


如 果 你 将 第 4 章 的 例子 中 的 std: :async 蔡 换 成 为 本 章 你 已 经 见 到 的 简单 线程 
池 的 时 候 ， 你 会 们 到 同样 的 问题 。 线 程 池 中 只 有 有 限 数目 的 线程 ， 他 们 可 能 都 售 
在 等 竺 某 个 还 没有 被 执行 的 任务 。 所 以 你 需要 一 个 与 你 在 第 8 章 见 到 的 类 似 的 解 
决 方案 ， 当 你 在 等 等 你 的 数据 块 结束 的 时 候 去 处 理 未 完成 的 数据 块 。 当 你 在 使 用 
线程 池 来 管理 任务 列表 以 及 它们 关联 的 线程 的 时 候 ， 你 不 必 去 通过 访问 任务 列表 
来 完成 这 个 。 你 需要 做 的 是 修改 线程 池 的 结构 来 自动 完成 这 个 。 


最 简单 的 访问 来 完成 这 个 功能 的 是 在 线程 池 中 增加 一 个 新 的 函数 来 执行 队列 
中 的 任务 以 及 自己 管理 循环 。 高 级 线程 池 的 实现 可 能 会 在 等 待 函数 添加 逻辑 来 处 
理 这 种 情形 ， 有 可 能 是 通过 给 每 个 在 等 待 的 任务 赋予 优先 级 来 解决 。 代 码 清单 9.4 
展示 了 一 个 新 的 函数 run_pending_task()， 代码 清 单 9.5 展 示 了 使 用 这 个 函数 来 
实现 快速 排序 。 


清单 9.4 run pending task()I] XIN 


void thread pool: :run pending task() 


{ 
function_wrapper task; 
if (work_queue.try_pop (task) ) 
{ 
task (); 
j 
else 
{ 
std::this thread::yield(); 
j 
j 


run_pending_stask() 的 这 个 实现 是 从 worker_thread() 函 数 的 主 循环 中 
提升 出 来 的 ， 它 现在 被 修改 为 提取 的 run_pending_ task()。 它 试图 从 队列 中 取 
出 一 个 任务 ， 如 果 成 功 则 执行 取出 的 任务 ， 和 否则 它 放 弃 CPU， 人 允许 操作 系统 重新 
调度 线程 。 清 单 9.5 的 快速 排序 的 实现 要 比 代 码 清单 8.1 的 对 应 实现 要 简单 很 多 ， 
因为 所 有 管理 线程 的 逻辑 被 移动 到 了 线程 内 部 中 。 


清单 9.5 ”基于 线程 池 的 快速 排序 的 实现 


template<typename T> 


struct sorter <0 
{ 
thread pool pool; -© 


std::list<T> do sort (std::list<T>& chunk data) 


{ 


if (chunk data.empty()) 


{ 
} 


std::liste«T> result; 
result .splice (result.begin() ,chunk_data, chunk_data.begin()); 
T const& partition val-*result.begin(); 


return chunk data; 


typename std::list<T>::iterator divide_point= 
std: :partition(chunk_data.begin(),chunk_data.end(), 
[&] (T const& val) {return val«partition val;]); 


Std::list«T» new lower chunk; 

new lower chunk.spliceí(new lower chunk.end(), 
chunk data,chunk data.begin(), 
divide point); 


Std::future«std::list«T» > new lower- a 
pool.submit(std::bind(&sorter::do sort,this, 
std::move(new lower chunk))); 


Std::list«T» new higher(do sort (chunk data)); 


result.splice(result.end(),new higher); 
while (!new_lower.wait_for(std::chrono::seconds(0)) == 
std::future_ status: :timeout) 


{ 
} 


result .splice (result .begin(),new_lower.get ()); 
return result; 


pool.run pending task(); —,0 


ps 


template«typename T> 
std::list<T> parallel quick sort(std::list«T» input) 


{ 


if (input.empty ()) 


{ 
} 


sorter«T» s; 


return input; 


return s.do sort (input); 


正如 清单 8.1 一 样 ， 你 将 实际 的 排序 工作 放 到 了 sorter 类 模板 中 的 成 员 函 
数 do_sort() 中 国 ， 虽 然 在 这 个 例子 中 这 个 类 知识 简单 的 包装 了 thread_pool1 的 
KHO. 


你 的 线程 和 任务 管理 要 做 的 是 向 线程 池 提 交 一 个 任务 @ 和 执行 正在 等 待 的 任 
务 四 .这 个 实现 比 清单 8.1 简 单 很 多 。 在 清单 8.1 中 ， 你 不 得 不 显 式 的 管理 线程 和 
栈 中 待 排序 的 数据 块 。 当 向 线程 池 提 交 任 务 时 ， 你 使 用 std: :bind 将 this 指 针 绑 
定 给 do_sort() 和 提供 要 排序 的 数据 。 在 这 个 例子 中 ， 你 使 用 std: :move 作 用 
在 new_Lower_chunk 作 为 参数 传 进去 ， 来 保证 数据 是 被 移动 而 不 是 新 的 拷贝 。 


虽然 现在 的 线程 池 解 决 了 任务 等 竺 其 他 任务 中 的 关键 死 锁 问 题 ， 这 个 线程 池 


仍然 远 远 不 是 理想 的 。 对 于 使 用 者 来 说 ， 每 个 submit 的 调用 和 每 
个 run_pending task 都 访问 同一 个 队列 。 在 第 8 章 你 已 经 见 过 一 个 集合 的 数据 被 
多 个 线程 并 发 的 访问 会 大 大 的 降低 性 能 ， 所 以 你 需要 别 的 方法 来 解决 这 个 问题 。 


9.1.4 避免 工作 队列 上 的 竞争 


每 次 线程 调用 submit() 时 ， 它 向 单个 共享 工作 队列 添加 一 个 新 的 元 素 。 类 似 
的 情形 为 ， 工 作 线 程 不 停 的 从 队列 中 取出 元 素来 执行 。 这 意味 着 随 着 处 理 器 数目 
的 增加 ， 工 作 队 列 的 了 范 争 会 越 来 越 多 ， 这 会 极 大 地 降低 性 能 。 即 使 你 使 用 无 锁 队 
列 ， 虽 然 没 有 显 式 的 等 待 ， 但 是 乒乓 缓存 会 非常 耗 时 。 


避免 乒乓 缓存 的 一 个 方法 是 在 每 个 线程 都 使 用 一 个 单独 的 工作 队列 。 每 个 线 
程 将 新 的 任务 添加 到 它 自己 的 队列 中 ， 只 有 妆 自 己 队 列 为 空 的 时 候 才 从 全 局 的 工 
作 队 列 中 取 任 务 。 清 单 9.6 展 示 了 一 个 使 用 thread_local 变 量 来 保证 每 个 线程 有 
一 个 自己 的 工作 队列 再 加 上 一 个 全 局 的 工作 队列 。 


清单 9.6 使 用 本 地 线程 工作 队列 的 线程 池 


class thread pool 
{ 


thread safe queue«function wrapper» pool work queue; 


typedef std::queue«function wrapper» local queue type; 0 
static thread local std::unique ptr«local queue type» 
local work queue; “o 
void worker thread () 
{ 
local_work_queue.reset (new local_queue_type) ; +@ 


while (!done) 


{ 
} 


run pending task(); 


} 


public: 
template<typename FunctionType> 


std::future<typename std::result of«FunctionType()»::type» 
submit (FunctionType f) 
{ 


typedef typename std::result_of<FunctionType()>::type result_type; 


std: :packaged_task<result_type()> task(f); 
std: :future<result_type> res(task.get future()); 
if(local work queue) 0O 


{ 
} 


else 


{ 
} 


return res; 


local work _queue->push (std: :move (task) ) ; 


pool _work_queue.push(std: :move (task) }; «— 


void run_pending_task() 
{ 
function wrapper task; 
if(local work queue && !local work queue-»empty()) O 
{ 
task=std: :move (local work queue-»front()); 
local work queue-»pop(); 
task(): 
) 
else if (pool_work_queue.try_pop (task) } -© 
{ 
task (}; 
} 
else 


{ 
} 


std::this thread::yield(); 


Ji rest as before 


我 们 使 用 一 个 std: :unique_ptr<> 来 保存 线程 私有 的 工作 队列 因为 我 们 不 想 
让 非 线程 池 中 的 线程 也 持 有 一 个 全， 这 个 是 在 worker_thread() 中 主 循 环 之 前 进 
行 初始 化 人 @。std: :unique_ptr<> 的 析 构 函数 保证 了 当 线 程 退 出 的 时 候 其 工作 队 
列 会 被 适当 地 销毁 。 


submit() 函 数 会 检查 当前 线程 是 否 有 一 个 工作 队列 人 @。 如 果 有 ， 则 说 明 当 前 
线程 是 一 个 线程 池 中 的 线程 ， 这 是 可 以 将 任务 添加 到 私有 的 工作 队列 中 ， 否 则 像 
之 前 一 样 将 任务 加 入 到 全 局 工作 队列 中 人 @。 


在 run_pending_task() 中 有 一 个 类 似 的 检查 @， 不 过 这 次 是 检查 私有 队列 
中 是 否 有 任务 。 如 果 有 ， 可 以 从 队列 中 取出 一 个 来 处 理 。 注 意 到 私有 队列 可 以 是 

通 的 std: :queue<>@ 因 为 私有 队列 只 被 一 个 线程 访问 。 如 果 私 有 队列 中 没有 
任务 ， 则 像 之 前 一 样 从 全 局 队列 取 任 务 @。 


能 够 很 好 地 降低 对 全 局 队列 的 竞争 ， 但 是 当 任 务 的 分 布 是 不 平衡 的 ， 可 能 
导致 一 - 些 线程 的 私有 队列 中 有 大 量 的 任务 曾 另外 二 些 线程 则 没有 任务 处 理 。 比 
如 ， 在 快速 排序 中 ， 只 有 最 顶层 的 任务 会 被 添加 到 全 局 工作 队列 中 ， 因 为 其 余 的 
数据 会 放 在 杂 个 工作 线程 的 私有 队列 中 。 这 跟 使 用 线程 池 的 初衷 是 相反 的 。 


壮 运 的 是 ， 有 一 些 办 法 来 解决 这 个 问题 。 只 要 允许 线程 在 自己 私有 队列 以 及 
全 局 队列 中 都 没有 任务 时 从 其 他 线程 的 队列 中 窃取 工作 。 


9.1.5 工作 窃取 


为 了 人 允许 一 个 空闲 的 线程 执行 其 他 线程 上 的 任务 ， 每 个 工作 线程 的 私有 队列 
必须 在 run_pending task() 中 熏 取 任务 的 时 候 可 以 被 访问 到 。 这 要 求 每 个 工作 
线程 将 自己 的 私有 任务 队列 向 线程 池 注 册 或 者 每 个 线程 都 会 被 线程 池 分 配 一 个 工 
作 队 列 。 此 外 ， 你 必须 保证 工作 队列 中 的 数据 被 适当 的 同步 和 保护 ， 这 样 你 的 不 
变量 是 被 保护 的 。 


编写 一 个 允许 拥有 队列 的 线程 在 一 端 push 和 pop 同 时 其 他 线程 在 另外 一 端 进行 
任务 窃取 的 无 锁 队 列 是 有 可 能 的 。 但 是 实现 这 样 一 个 队列 比较 复杂 ， 超 出 了 本 书 
的 范围 。 为 了 验证 这 个 想法 ， 我 们 使 用 互 斥 锁 来 保护 队列 的 数据 。 我 们 和 希望 任务 
禄 取 是 一 个 不 经 常 发 生 的 时 间 ， 这 样 互 斥 元 的 竞争 就 不 是 那么 激烈 ， 这 样 一 个 简 
PUNTA FILS RL — MRS ROT AT a» 清单 9.7 所 示 是 一 个 简单 的 基于 锁 的 实 
JW. 


清单 9.7 ”人 允许 任务 禄 取 的 基于 锁 的 队列 


class work stealing queue 


{ 


private: 
typedef function_wrapper data_type; 
std: :deque<data_type> the queue; +@ 


mutable std: :mutex the mutex; 


public: 
work stealing queue ({} 


{} 


work stealing queue(const work stealing queue& other) =delete; 
work stealing queue& operator-( 
const work stealing queue& other) =delete; 


void push(data type data) -© 

{ 
std::lock guard«std::mutex» lock(the_mutex) ; 
the queue.push front (std: :move (data) ) ; 


} 


bool emptyí() const 

{ 
std::lock_guard<std: :mutex> lock(the mutex); 
return the queue.empty(); 


} 


bool try popldata type& res) +@ 
{ 


Std::lock guard«std::mutex» lock(the mutex); 
if(the queue.empty()) 


{ 
} 


res=std: :move (the queue.front()); 
the queue.pop front (); 
return true; 


return false; 


} 


bool try steal (data_type& res) —0 


{ 
std::lock_guard<std::mutex> lock (the_mutex) ; 
if (the queue.empty()) 


} 


res=std: :move(the queue.back()); 
the queue.pop back(); 
return trug; 


return false; 


}; 


这 个 队列 是 一 个 对 std: :deque<function_wraper>@ 的 封装 ， 使 用 一 个 互 
斥 锁 来 保护 所 有 的 访问 。push() 人 和 try_pop() 全 在 队列 尖 部 操作 ， 
而 try_steal() 人 @ 在 队列 尾部 操作 。 


这 实际 上 意味 着 这 个 队列 对 于 拥有 线程 来 说 是 一 个 后 进 先 出 的 栈 。 最 近 被 放 
到 队列 中 的 任务 会 最 先 被 取出 来 执行 。 从 缓存 的 角度 来 说 这 可 以 提高 性 能 ， 因 为 
对 比 之 前 被 放 入 队列 中 的 任务 ， 被 取出 的 任务 的 数据 更 加 有 可 能 在 缓存 中 。 同 
样 ， 这 个 队列 能 够 很 好 的 映射 像 快 速 排序 之 类 的 算法 。 在 之 前 的 实现 中 ， 每 次 调 
用 do_sort() 将 一 个 数据 放 到 栈 中 然后 等 待 它 完 成 。 通 过 处 理 最 近 放 入 的 数据 ， 
你 可 以 保证 当前 调用 完成 需要 的 数据 块 会 比 其 他 分 支 调 用 需要 的 数据 块 先 处 理 
好 ， 这 样 可 以 减少 活动 的 任务 数目 和 总 的 栈 空间 使 用 量 。try_steal() 从 队列 的 
另外 一 端 取 数 据 ， 这 样 可 以 最 小 化 竞争 。 你 同样 可 以 使 用 第 6 章 和 第 7 章 中 的 技术 
来 实现 并 发 调用 try_pop() 和 try_steal()。 


现在 你 已 经 有 一 个 很 好 的 允许 窃取 的 工作 队列 ， 怎 样 把 它 使 用 在 你 自己 的 线 
程 池 中 呢 ? 清单 9.8 是 一 个 可 能 的 实现 。 


清单 9.8 ”使 用 工作 禄 取 的 线程 池 


class thread_pool 


{ 


typedef function_wrapper task_type; 


std::atomic_bool done; 

thread safe queue«task type» pool work queue; 
Std::vector«std::unique ptr«work stealing queue» » queues; ER T, 
std::vector«std::thread» threads; 

join threads joiner; 


static thread local work stealing queue* local work queue; O 
static thread local unsigned my index; 


void worker thread(unsigned my index ) 


{ 
my index=my_index_; 
local work queue-queues [my_index] .get () ; «e 
whileí!done) 


{ 
} 


run pending task(); 


bool pop task from local queue {task type& task) 


{ 
} 


bool pop task from pool queue(task type& task) 


{ 
} 


bool pop task from other thread queue(task type& task) 0 


{ 


return local work queue && local work queue-»try pop(task) ; 


return pool work queue.try pop(task); 


for (unsigned i=0;i<queues.size() ;++1) 

{ 
unsigned const index=(my_index+i+1) %queues.size(); + 人 © 
if (queues [index] ->try steal (task)) 


{ 
} 


return true; 


} 


return false; 


} 


public: 
thread _ pool (): 
done (false) , Joiner (threads) 


{ 
unsigned const thread count-std::thread::hardware concurrency(); 
try 
{ 
for (unsigned i=0;i<thread_count;++i) 
{ 
queues.push backí(std::unique ptr«work stealing queue»( +@ 
new work stealing queue) ) ; 
threads .push_back ( 
Std::thread(&thread pool::worker thread,this,i)); 
) 
) 
catch(...) 
{ 
done=true; 
throw; 
} 
} 
~thread_pool () 


{ 
} 


template<typename FunctionType> 


std::future<typename std::result of«FunctionType()»::type» submit ( 
FunctionType f) 


done=true; 


typedef typename std::result of«FunctionType()»::type result type; 


std: :packaged task«result type()» taskí{f); 
std::future«result type» res(task.get_future()); 
if(local work queue) 


{ 
} 


else 


{ 
} 


return res; 


local_work_queue->push (std: :move (task) }; 


pool work queue .push (std: :move (task) ) ; 


} 


void run pending taskí) 


{ 
task type task; - 
if (pop task from local queue (task) || 


| 
pop task from pool queue(task) || -© 
pop task from other thread queue (task)) -© 


{ 
} 
else 


{ 
} 


task{); 


std::this_thread::yield(); 


这 个 实现 跟 清单 9.6 中 的 实现 非常 类 似 。 第 一 个 区 别 在 于 每 个 线程 都 拥有 一 
个 work_stealing_queue， 而 不 是 普通 的 std: :queue<> 人 @。 当 创建 每 个 线程 的 
时 候 ， 不 是 每 个 线程 都 创建 一 个 自己 的 工作 队列 ， 而 是 线程 池 的 构造 器 为 其 分 配 
一 个 @， 这 个 队列 是 存储 在 一 个 工作 队列 的 表 中 @。 队 列 的 下 标 被 传递 给 线程 函 
数 ， 然 后 被 用 来 获得 指向 队列 的 指针 @。 这 意味 着 当 试 图 为 空闲 线程 窃取 任务 时 
线程 池 可 以 访问 该 队列 。run_pending task() 现 在 会 试图 从 自己 队列 中 取出 任 
务 @， 从 池 队 列 中 取出 任务 @， 或 是 从 其 他 线程 的 队列 中 取出 工作 @。 


pop_task_from_other_thread_queue()@ 遍 历 线 程 池 中 所 有 线程 的 队 
列 ， 试 图 一 次 从 每 个 队列 中 和 窍 取 一 个 任务 。 为 了 避免 每 个 线程 都 从 第 一 个 线程 的 
人 通过 用 自己 队列 的 下 标 来 偏 移 
队列 下 标 他。 


现在 你 有 一 个 线程 池 可 以 应 用 在 许多 地 方 。 当 然 ， 仍 然 有 许多 方法 针对 一 些 
特别 的 用 法 去 提高 它 。 这 个 是 留 给 读者 的 练习 。 一 个 没有 被 提 及 的 方面 是 当 线程 
被 阻塞 了 ， 在 等 待 如 输入 输出 或 者 互 斥 锁 ， 动 态 地 修改 线程 池 的 大 小 来 保证 有 最 
优 的 CPU 使 用 率 。 


下 一 个 “高 级 ”的 线程 管理 技术 是 中 断 线程 。 


9.2 中断 线程 


在 许多 场景 中 ， 向 一 个 长 时 间 运 行 的 线程 发 出 一 个 信号 告诉 线程 是 停止 执行 
的 时 候 是 一 个 很 淘 望 的 行为 。 这 有 可 能 是 因为 线程 是 一 个 线程 池 的 工作 线程 而 线 
程 地 正在 被 销毁 ， 或 者 是 因为 线程 正在 执行 的 工作 被 用 户 显 式 地 取消 了 ， 或 者 是 
因为 其 他 一 些 原因 。 不 管 是 何 种 原因 ， 基 本 思想 是 一 样 的， 你 需要 从 一 个 线程 发 
送 一 个 信号 告诉 另外 一 个 线程 应 该 停止 运行 而 不 是 一 直 执行 到 线程 自然 结束 ， 你 
同样 需要 让 线程 适当 的 结束 而 不 是 简单 的 退出 而 造成 线程 池 不 一 致 的 状态 。 


你 当然 可 以 为 每 种 情况 都 设计 一 种 单独 的 机 制 ， 但 是 这 种 做 法 没有 通用 性 ， 
引入 许多 重复 工作 。 一 种 共有 的 机 制 不 但 可 以 让 为 后 面 的 场景 写 代码 变 得 容易 ， 
而 且 多 许 你 写 出 能 够 被 中 断 ， 不 用 担心 在 什么 地 方 被 使 用 的 代码 。C++11 标 准 病 
没有 提供 这 样 的 机 制 ， 但 是 建立 这 样 的 机 制 是 相对 直观 的 。 让 我 们 先 看 看 怎样 可 
以 完成 这 个 机 制 ， 从 启动 和 中 断 一 个 线程 的 接口 的 角度 开始 。 


9.2.1 启动 和 中 断 另 一 个 线程 


首先 让 我 们 从 可 中 断 线程 的 接口 开始 。 一 个 可 中 断 线程 的 接口 需要 有 哪些 
We? 在 最 基本 的 层次 上 ， 所 有 你 需要 的 是 跟 std: :thread 一 样 的 接口 ， 外 加 一 
个 ijnterrupt() 函 数 。 


class interruptible thread 

{ 

public: 
template<typename FunctionType> 
interruptible thread(FunctionType £f); 
void Tout.) 
void detach(); 
bool joinable() const; 
void interrupt (); 


\; 


在 内 部 ， 你 可 以 使 用 std: :thread 来 管理 线程 本 身 ， 然 后 使 用 一 些 定制 的 数 
据 结 构 来 处 理 中 断 。 从 线程 本 身 的 角度 来 看 中 断 是 什么 呢 ? 在 最 基本 的 层面 上 你 
也 许 会 说 “我 可 以 在 这 里 被 中 断 ”， 你 想 要 一 个 中 断 点 。 为 了 让 这 个 能 够 不 用 传递 
额外 的 参数 就 能 使 用 ， 需 要 一 个 简单 的 不 带 任何 参数 的 函 
数 : interruption_point()。 这 意味 着 中 断 相 关 的 数据 结构 需要 使 用 一 
个 thread_local 的 变量 来 访问 ， 这 个 私有 变量 是 在 线程 启动 的 时 候 设 置 好 的 。 
这 样 当 一 个 线程 调用 你 的 jnterruption_point() 函 数 的 时 候 ， 它 会 检查 当前 运 


行 的 线程 的 数据 结构 。 我 们 随后 会 给 出 interruption_point() 的 实现 。 


这 个 thread_local 标 志 是 你 不 能 简单 的 使 用 std: :thread 来 管理 线程 的 主 
BURA; 它 需 要 使 用 特殊 的 分 配方 法 ， 使 得 jnterruptible_thread 实 例 可 以 访 
问 ， 并 且 新 启动 的 线程 也 能 够 访问 。 你 可 以 通过 在 传递 给 std: :thread 实 际 启动 
一 个 线程 的 之 前 包装 一 下 ， 如 清单 9.9 所 示 。 


清单 9.9 ”interruptible_thread 的 基本 实现 


class interrupt flag 


{ 
public: 
void set(); 
bool is set{) const; 
): 
thread local interrupt flag this thread interrupt flag; 0 


class interruptible thread 

{ 
std::thread internal thread; 
interrupt flag* flag: 

public: 
template<typename FunctionType> 
interruptible thread(FunctionType f) 


{ 
std: :promise<interrupt_flag*> p; 
internal thread=std: :thread([f, &p] { 
p.set value (&this thread interrupt flag); 
Es 
DE 
flag-p.get future().get(); -© 
} 
void interrupt () 
{ 
if (flag) 
{ 
flag-»set(); <O 
} 
} 


\; 


用 户 给 定 的 函数 f 被 包装 在 一 个 lambda 函 数 中 全 。 在 此 函数 中 ， 保 存 了 一 份 f 
的 拷贝 以 及 一 个 局 部 promise 的 引用 p 人 @。lambda 函 数 在 调用 用 户 提供 的 函数 之 前 


@@ 为 新 的 线程 将 promise 设 置 为 this_thread_interrupt flag (这 个 变量 被 声 
HH Athread_local@) 的 地 址 。 被 调用 的 线程 然后 会 等 待 跟 promise 相 关联 的 
future 变 得 可 用 ， 然 后 存储 在 fl1ag 成 员 变 量 中 加 .注意 到 即使 ambda 函 数 是 运行 
在 新 线程 上 面 ， 并 且 持 有 一 个 对 局 部 变量 p 的 应 用 ， 这 是 没有 问题 的 。 因 
Jjinterruptible thread 的 构造 函数 会 一 直 等 待 直到 p 不 再 被 新 的 线程 引用 。 
注意 这 个 实现 不 负责 处 理 等 待 线程 结束 或 者 分 离线 程 。 你 需要 保证 当 线 程 存在 的 
时 候 或 者 被 分 离 了 ，f1lag 标 志 被 清理 掉 来 避免 危险 的 指针 。 


interrupt() 函 数 是 一 个 相对 直观 的 实现 ， 如 果 你 有 一 个 合法 的 指针 指 同 一 
个 中 断 标志 ， 你 有 一 个 线程 可 以 中 断 ， 所 以 只 要 设置 flag 就 可 以 @。 线 程 中 断 标 
志 设 置 后 ， 有 被 中 断 的 线程 来 决定 怎么 处 理 这 个 中 断 。 


9.2.2. ”检测 一 个 线程 是 否 被 中 断 


现在 你 可 以 设置 中 断 标 志 了 ， 但 是 如 果 线 程 不 去 检查 它 目 身 是 否 被 中 断 的 话 
不 会 给 你 带 来 任何 好 处 。 在 最 简单 的 情况 下 ， 你 可 以 使 
用 interruption_point() 函 数 来 检查 线程 自身 是 否 被 中 断 ; 你 可 以 当 线 程 可 以 
被 安全 的 中 断 的 时 候 调 用 这 个 函数 ， 如 果 中 断 标 志 被 设置 的 话 它 会 抛 出 一 


个 thread_interrupted 异 常 。 


void interruption point(í) 


{ 
if(this thread interrupt flag.is set()) 
{ 
throw thread interrupted); 
j 
j 


你 可 以 在 某 个 方便 的 点 上 调用 这 个 函数 。 


void foot) 


{ 
whileí!'done) 
{ 
interruption point () ; 
process next itemí); 
j 
j 


虽然 这 可 以 工作 ， 但 是 它 不 完美 。 在 一 些 中 断 线 程 最 好 的 地 方 是 它 被 阻塞 住 


了 ， 正 在 等 待 某 个 信号 。 这 意味 着 线程 为 了 调用 interruption_point() 没 有 在 
运行 ! 在 这 里 你 需要 的 是 一 个 通过 使 用 中 断 的 方式 来 等 待 某 个 事情 。 


9.2.3 中断 等 竺 条件 变量 


现在 你 可 以 通过 在 精心 选 定 的 位 置 上 显 式 调用 interruption_point() 来 检 
测 中 断 。 但 是 当 你 想 要 一 个 阻塞 等 待 的 时 间 ， 如 等 符 一 个 条 件 变 量 被 通知 ， 这 不 
能 给 你 多 少 帮 助 。 你 需要 一 个 新 的 函数 interruptible_wait()， 这 个 函数 你 可 
以 为 你 想 要 等 符 的 不 同 的 事情 重 载 。 你 可 以 知道 怎样 中 断 一 个 等 竺 工作。 我 已 经 
提 到 一 个 你 可 能 想 要 等 待 的 是 条 件 变 量 ， 所 以 让 我 们 从 条 件 变 量 开 始 。 为 了 能 够 
中 断 一 个 条 件 变量 的 等 待 ， 你 需要 怎样 做 呢 ? 最 简单 的 事情 是 当 你 设置 中 断 标志 
的 时 候 通 知 条 件 变 量 ， 然 后 在 等 待 的 后 面 立 即 加 上 一 个 中 断 点 。 但 是 为 了 让 这 种 
方式 可 以 工作 ， 你 不 得 不 通知 所 有 等 待 该 条 件 变 量 的 线程 来 保证 你 感 兴趣 的 线程 
被 唤醒 。 等 待 者 们 需要 处 理 假 的 唤醒 ， 使 得 其 他 线程 能 够 将 这 个 事件 当成 一 个 假 
的 唤醒 。interrupt_f1ag 结 构 需 要 能 够 存储 一 个 指向 条 件 变量 的 指针 这 样 它 可 
以 在 有 调用 set() 的 时 候 被 通知 。interruptible_wait() 的 一 个 关于 条 件 变量 
的 实现 如 下 面 清 单 9.10 中 的 代码 所 示 。 


清单 9.10 std::condition_variable 而 遭 到 破坏 的 interruptible_wait 函 数 实现 


void interruptible wait (std::condition variable& cv, 
std: :unique_lock<std: :mutex>& lk) 


interruption_point (); 


this thread interrupt flag.set condition variable(cv); +@ 
cv.wait (lk); 
this thread interrupt flag.clear condition variable(); «9 


interruption point(); 


fixe CCELI RANA PUB HJ 2 TE AE EC] PRE, MASE DL 
而 且 简 单 的 。 它 先 检查 中 断 ， 然 后 为 当前 线程 关联 一 个 带 ijnterrupt_flag 的 条 
件 变量 @， 等 待 条 件 变 量 @@， 清 除 关 联 的 条 件 变 量 @， 然 后 再 一 次 检查 中 断 。 如 
有 果 线 程 是 在 等 竺 条件 变量 的 时 候 被 中 断 的 ， 调 用 中 断 的 线程 会 广播 条 件 变 量 将 你 
唤醒 ， 所 以 你 可 以 检查 中 断 。 不 幸 的 是 ， 这 份 代 码 是 不 能 工作 的 。 它 存在 两 个 问 
题 。 第 一 个 问题 相对 比较 明显 。 因 为 std: :condition_variable: :wait() 可 能 
会 抛 出 异常 ， 所 以 你 可 能 没有 删除 中 断 标志 和 条 件 变 量 的 关联 就 退出 了 。 这 可 以 
通过 使 用 一 个 结构 的 析 构 函数 来 删除 关联 性 来 修复 它 。 


第 二 个 问题 不 是 那么 明显 。 这 份 代 码 中 存在 一 个 竞争 条 件 ， 如 果 线 程 是 在 调 
用 interruption_point() 后 面 被 中 断 ， 那 么 条 件 变 量 是 否 跟 中 断 标志 关联 已 经 
不 要 紧 了 ， 因 为 线程 不 是 在 等 待 所 以 不 能 被 条 件 变量 唤醒 。 你 需要 保证 线程 在 上 
一 次 检查 中 断 和 调用 wait() 之 间 不 能 被 通知 。 在 不 改变 


std::condition _ variable 内 部 结构 的 情况 下 ， 你 只 有 一 种 方法 来 做 这 个 ， 使 
用 1LKk 持 有 的 互 斥 锁 来 保持 这 块 区 域 。 这 要 求 将 其 传递 给 调 

用 set_condition_variable。 不 幸 的 是 ， 这 又 会 产生 一 个 问题 ， 你 需要 传递 一 
个 生命 周期 未 知 的 互 斥 锁 给 另外 一 个 线程 ， 那 个 线程 在 不 知道 它 是 否 已 经 锁 住 互 
斥 锁 的 情况 下 试图 锁 住 。 这 有 洪 在 的 死 锁 可 能 ， 以 及 试图 锁 住 一 个 已 经 被 销毁 的 
互 斥 锁 。 如 果 不 能 可 靠 地 中 断 一 个 条 件 变 量 的 等 待 ， 限 制 会 非常 大 一 一 你 可 以 在 
没有 特殊 的 interruptible_wait() 做 得 几乎 一 样 好 一 一 那么 你 还 有 其 他 什么 可 
选 的 方法 呢 ? 一 个 选项 是 在 等 待 中 放 入 一 个 等 待 的 最 大 时 间 ， 给 wait_for() 传 
递 一 个 很 小 的 时 间 间 隔 《〈《 如 1 毫秒 ) 而 不 是 使 用 wait()。 这 给 线程 在 看 到 中 断 前 
等 待 的 时 间 设 置 了 一 个 上 限 。 如 果 你 这 样 做 ， 等 待 的 线程 会 看 到 由 定时 器 到 期 带 
来 的 大 量 的 假 唤醒 ， 但 是 它 不 能 轻易 地 带 来 帮助 。 清 单 9.11 是 这 样 的 一 个 实现 ， 

还 有 对 应 的 interrupt_flag 的 实现 。 


清单 9.11 在 为 std::condition_variable 的 interruptible_wait 中 使 用 超时 


class interrupt flag 
std::atomic<bool> flag; 
std::condition_variable* thread_cond; 
std: :mutex set clear mutex; 


public: 
interrupt_flag(): 
thread cond(0) 

Ü 


void set() 


{ 


flagq.store (true, std: :memory order relaxed); 
Std::lock guard«std::mutex» lk{set clear mutex); 
if (thread cond) 


{ 
} 


thread cond-»notify all(); 


} 


bool is_set() const 


{ 
} 


void set condition variable(std::condition variable& cv) 


{ 


return flag.load(std::memory order relaxed); 


Std::lock guard«std::mutex» lkí(set clear mutex); 
thread cond-&cv; 


} 


void clear condition variable () 


{ 


std::lock guard«std::mutex» lk(set clear mutex) ; 
thread cond-0; 


} 


struct clear cv on destruct 


{ 


~clear_cv_on_destruct () 


{ 
} 


this thread interrupt flag.clear condition variable(); 


): 
): 


void interruptible wait(std::condition variable& cv, 
std: :unique_lock<std: :mutex>& lk) 


{ 


interruption point () ; 

this thread interrupt flag.set condition variable(cv); 
interrupt flag::elear cv on destruct guard; 
interruptaon poznti); 

Cv.wait for(lk,std::chrono::milliseconds(1)); 
interruption point(); 


" 如 果 你 有 一 个 要 等 竺 的 断言 ， 那 么 1 坚 秒 的 超时 会 被 完全 隐藏 在 断言 的 循环 


template<typename Predicate> 

void interruptible wait (std: :condition variable& cv, 
std: :unique lock«std::mutex»& lk, 
Predicate pred) 


{ 
interruption point (}; 
this thread interrupt flag.set. condition variable (cv); 
interrupt flag::clear cv on destruct guard; 
while(!this thread interrupt flag.is set() && !pred()) 
{ 
cv.wait _for(lk,std::chrono: :milliseconds(1)}; 
} 
interruption point (); 
} 


这 会 导致 等 待 的 条 件 被 检查 很 多 次 ， 但 是 非常 容易 地 用 于 代替 wait() 函 数 调 
用 。 带 定时 器 的 变形 也 非常 容易 实现 ， 只 要 等 待 一 个 给 定 的 时 间 ， 如 1 毫 秒 ， 或 
者 其 他 短 时 间 。 现 在 std: :condition_variable 等 待 已 久 可 以 处 理 的 ， 怎 样 等 
待 一 个 std: :condition _ variable_any 变 量 呢 ? 是 与 此 相同 ， 或 者 你 能 做 得 更 
好 ? 


9.2.4 中 断 在 std::condition_variable_any 上 的 等 待 


std::condition variable_any 变 量 跟 std: :condition _ variable 不 同 
的 是 它 可 以 跟 任 何 锁 类 型 配合 工作 而 不 是 只 能 跟 
std: :unique_lock<std: :mutex> 配 合 。 结 果 是 这 会 让 事情 变 得 简单 ， 你 可 以 更 
好 地 处 理 std: :condition _ variable_any。 因 为 它 可 以 跟 任 何 锁 配 合 ， 你 可 以 
建立 自己 的 锁 类 型 用 来 加 锁 / 解 锁 interrupt_flag 的 内 部 函数 set_clear_mutex 
以 及 提供 给 等 待 调用 的 锁 ， 如 下 面 清 单 9.12 所 示 。 


清单 9.12 ”为 std::condition_variable_any 而 设 的 interruptible_wait 


class interrupt flag 


{ 
std::atomic<bool> flag; 
std::condition variable* thread cond; 
std::eondition variable any* thread cond any; 
std: «mutex set clear mubex; 

pub lanes 


interrupt £lag(): 


thread cond(0),thread cond any(0) 


Ü 


void set() 


{ 
flag.store(true,std::memory order relaxed); 
Std::lock guard«std::mutex» lkí(set clear mutex); 
if (thread cond) 


{ 
} 
else if (thread_cond_any) 


{ 
} 


thread cond-»notify all(); 


thread cond any-»notify all(); 


j 


template«typename Lockable> 
void wait(std::condition variable any& cv,Lockable& 1k) 


{ 


struct custom_lock 


{ 


interrupt flag* self; 
Lockable& lk; 


custom lock(interrupt flag* self , 
std: :condition variable any& cond, 
Lockable& lk ): 
self(self ),lk(lk ) 


self-»set clear mutex.lock(); av 
self->thread_cond_any=&cond; +@ 


} 


void unlock () -0 
{ 


lk. unlock (); 
self-»set clear mutex.unlock(); 


) 


void lock(í) 


{ 
} 


~custom_lock () 


{ 


std::lock(self-»set clear mutex,lk); —0 


self-»thread cond any-0; «9 
self-»set clear mutex.unlock(); 


Jus 

custom lock cl(this,cv,lk); 
interruption point(); 
cv.waitícl); 

interruption point(); 


// rest as before 


bi 


template<typename Lockable» 

void interruüptible ‘wait (std: scondition variable any& cv, 
Lockable& 1k) 

{ 


} 


this thread interrupt flag.wait (cv, lk); 


你 的 自 定义 锁 类 型 在 其 构造 函数 @ 中 获得 内 部 set_clear_mutex 锁 然后 设置 
指针 thread_cond_any 指 向 传递 给 构造 函数 的 
std::condition variable_any 变 量 。Lockable 引 用 保存 起 来 为 以 后 使 用 ， 这 
必须 已 经 被 锁 住 。 现 在 你 可 以 不 用 担心 竞争 来 检查 中 断 了 。 如 果 在 这 个 点 上 中 断 
标志 被 设置 ， 它 是 在 你 获得 set_clear_mutex 锁 之 前 被 设置 的 。 当 条 件 变量 调用 
你 的 unlock() 时 ， 你 释放 Lockable 对 象 以 及 内 部 的 set_clear_mutex@。 此 时 
允许 试图 中 断 你 的 线程 在 wait( ) 函 数 内 部 去 获得 set_clear_mutex 锁 和 检查 
thread_cond_any 指 针 ， 但 是 之 前 的 却 不 能 。 一 旦 wait() 函 数 结束 等 待 ， 它 会 
调用 你 的 lock() 函 数 ， 这 个 函数 再 次 去 获得 内 部 的 set_clear_mutex 和 
Lockable 对 象 的 锁 合 。 现 在 你 可 以 再 次 在 你 的 custom_1lock 的 析 构 函数 清 
理 thread_cond_any 指 针 之 前 再 次 调用 wait() 函 数 去 检查 中 断 回 。 
在 custom_lock 的 析 构 函数 中 你 也 会 释放 set_clear_mutex 锁 。 


9.2.5 中断 其 他 阻 堵 调用 


到 现在 为 止 我们 已 经 讨论 了 关于 条 件 变量 等 待 的 情况 ， 但 是 像 互 斥 锁 ，future 
以 及 其 他 类 似 的 阻塞 原 语 的 等 待 该 怎样 做 呢 ? 一 般 情 况 下 ， 你 不 得 不 使 用 一 个 用 
在 std: :condition 变 量 的 定时 器 选项 ， 因 为 在 不 访问 互 斥 元 或 者 future 的 内 部 结 
构 的 前 提 下 ， 没 有 办 法 来 中 断 一 个 短 时 间 的 等 待 。 但 是 使 用 定时 器 选项 你 知道 你 
要 等 待 什么， 所 以 你 可 以 在 interruptible _ wait() 函 数 中 循环 检查 。 作 为 一 个 
例子 ， 下 面 代码 是 针对 std: :future 的 interruptible_wait() 重 载 版 本 。 


template<typename T> 
void interruptible wait (std::future<T>& uf) 
{ 
while(!this thread interrupt flag.is setí)) 
{ 
if (uf.wait_for(1k,std::chrono: :milliseconds (1) == 
std: :future status: : ready} 
break; 


} 


interruption_point (); 


这 会 一 直 等 到 要 么 中 断 标志 被 设置 ， 要 么 future 已 经 准备 好 了 ， 但 是 每 次 在 
future 上 执行 阻塞 等 待 Ims。 这 意味 着 ， 假 定 使 用 高 精度 的 时 钟 ， 在 中 断 请 求 被 通 
知之 前 平均 每 次 大 概 需要 等 待 0.5ms。wait_for 函 数 经 常会 等 待 一 整个 时 钟 滴 
答 ， 所 以 如 果 你 的 时 钟 滴答 的 间隔 是 15ms， 你 会 每 次 至 少 等 待 15ms 而 不 是 lms。 
取决 于 应 用 场景 ， 这 有 可 能 会 变 得 无 可 坚守 。 你 总 是 可 以 降低 定时 器 到 期 的 时 间 
Be 这 会 增加 线程 切换 的 额 


到 现在 为 止 我 们 已 经 讨论 了 你 应 该 怎样 通过 使 用 interruption_point() 和 
interruptible_wait() 函 数 检 测 中 断 ， 但 是 你 应 该 怎样 处 理 中 断 呢 ? 


9.2.6 Abr 


从 被 中 断 的 线程 的 角度 来 看 ， 一 个 中 断 只 是 一 个 thread_interrupted 异 
常 。 这 可 以 像 其 他 异常 一 样 进行 处 理 。 典 型 的 操作 是 你 可 以 使 用 一 个 标准 的 
catch 块 来 捕获 它 。 


try 
{ 

do somethingí); 
} 
catch(thread_interruptedé&) 
{ 

handle_interruption(}); 
} 


这 意味 着 你 可 以 捕获 中 断 ， 用 某 些 方法 来 处 理 它 ， 然 后 继续 执行 。 如 果 你 这 
样 做 ， 另 外 一 个 线程 再 次 调用 interrupt()， 你 的 线程 在 调用 一 个 中 断 点 的 时 候 


会 再 次 被 中 断 。 你 可 能 想 这 样 做 如 果 你 的 线程 是 在 执行 一 系列 独立 的 任务 的 话 。 
中 断 一 个 任务 会 导致 那个 任务 被 放弃 ， 线 程 会 继续 执行 列表 中 的 下 一 个 任务 。 


因为 thread_interrupted 是 一 个 异常 ， 当 调用 能 产生 中 断 的 代码 段 的 时 候 
所 有 异常 安全 的 预防 措施 必须 被 执行 来 保证 资源 没有 被 泄露 以 及 数据 结构 保持 在 
一 个 一 致 的 状态 。 经 常 发 生 的 一 种 情况 是 让 中 断 来 结束 线程 ， 这 种 情况 下 你 只 要 
让 异常 抛 出 就 可 以 了 。 但 是 如 果 你 让 异常 传播 的 范围 超过 了 std: :thread 的 构造 
器 的 话 ，std: :terminate 将 会 被 调用 ， 整 个 程序 都 会 被 终止 。 为 了 避免 被 迫 记 
得 在 每 个 你 传递 到 interruptible _ thread 的 函数 中 放 一 
个 catch(thread_interrupted) 句 柄 ， 作 为 奉 代 ， 你 可 以 将 此 catch 块 放 到 你 用 
来 初始 化 interrupt_flag 的 包装 器 中 。 这 样 做 会 让 允许 中 断 异 常 未 被 处 理 而 传 
播 变 得 安全 ， 因 为 它 接 下 来 仅仅 会 终止 单独 一 条 线程 。 
在 interruptible_thread 构 造 函 数 中 的 线程 初始 化 现在 看 起 来 是 这 个 样子 。 


internal thread=std: :thread([f, &p] { 
p.set_value(&this thread interrupt flag); 


try 


{ 
} 


catch {thread interrupted consté&) 
{} 
})3 


Eej; 


现在 让 我 们 看 一 个 中 断 很 有 用 的 完整 例子 。 


9.27 ”在 应 用 退出 时 中 断后 台 任 务 


现在 考虑 桌面 搜索 应 用 。 此 应 用 也 与 用 户 进行 互动 ， 它 需要 监视 文件 系统 的 
状态 ， 识 别 所 有 的 改变 并 且 更 新 它 的 索引 。 为 了 避免 影响 GUI 的 啊 应 性 ， 这 种 处 
理 就 留 给 基础 线程 来 完成 。 这 个 基础 线程 需要 在 应 用 的 生命 期 始终 运行 ， 在 应 用 
初始 化 的 时 候 就 启用 它 ， 然 后 一 直 运 行 直到 应 用 结束 。 对 于 这 样 一 个 应 用 通常 只 
有 在 机 器 被 关机 的 时 候 才 会 发 生 ， 因 为 此 应 用 需要 始终 运行 来 保持 最 新 的 索引 。 
在 任何 情况 下 ， 当 应 用 结束 的 时 候 ， 就 需要 按 顺序 关闭 基础 线程 ， 实 现 它 的 一 种 
方法 就 是 中 断 它 。 


清单 9.13 展 示 了 这 样 一 个 系统 的 线程 管理 部 分 的 一 个 简单 实现 。 


清单 9.13 在 后 台 监 视 文 件 系统 


std: :muteX config mutex; 


std: :vector<interruptible thread» background threads; 


void background thread(int disk id) 


{ 


while (true} 


{ 


interruption point (}; 


fs change fsc=get fs changes (disk_id); 


if(fsc.has changes()) 


{ 
} 


update index(fsc); —9 


} 


void start background processing() 


{ 


background _threads.push_back ( 


«e. 


interruptible thread(background thread,disk 1)); 


background threads.push back ( 


interruptible thread(background thread,disk 2)); 


j 


int main() 


{ 


start background processing(); +Q 

process gui until exit(); O 
std: :unique lock«std::mutex» lk(config mutex) ; 

for (unsigned i=0;i<background_threads.size() ;++i) 


{ 
background threads [i] .interrupt (} ; 0 
} 
for (unsigned i-0;i«background threads.size();++i) 
{ 
background threads [i] .join() ; EE 7) 
} 


启动 的 时 候 ， 开 始 运 行 基 础 线程 @@。 人 然后 主线 程 将 基础 线程 与 处 理 GUI 一 起 
处 理 人 @。 当 用 户 要 求 应 用 退出 的 时 候 ， 中 断 这 些 基础 程序 @， 然 后 主线 程 等 待 每 
个 基础 线程 在 退出 前 完成 @。 基 础 线程 在 一 个 循环 里 聚集 ， 检 查 人 磁盘 变化 @ 并 且 
更 新 索引 人 @。 每 次 循环 它们 通过 调用 interruption_point() 检 查 中 断 @。 


为 什么 你 在 等 待 前 要 中 断 所 有 线程 ? 为 什么 不 逐个 中 断然 后 再 移动 到 下 一 个 
前 进行 等 待 ? 答案 就 是 并 发 性 。 当 线程 被 中 断 ， 它 们 不 会 立即 结束 ， 因 为 它们 在 
退出 前 必须 前 进 到 下 一 个 中 断 点 然后 运行 析 构 函数 调用 和 异常 处 理 代码 。 通 过 六 
即 联合 所 有 线程 ， 你 就 可 以 使 中 断 线程 等 待 ， 即 使 它 仍然 可 以 做 它 能 做 的 有 用 的 
工作 一 一 中 断 别 的 线程 。 你 等 待 直到 不 再 有 任何 工作 的 时 候 〈 所 有 线程 都 被 中 
断 ) ， 这 才 允 许 所 有 线程 被 中 断 来 并 行 地 处 理 它们 的 中 断 并 且 更 快 结 


这 种 中 断 的 方法 可 以 简单 扩展 为 增加 进一步 中 断 调 用 或 者 通过 一 个 具体 代码 
块 来 禁止 中 断 ， 但 是 这 将 留待 读者 考虑 。 


9.3 Ta oe 

KE, RAET FE RN Ae TE: 线程 池 和 中 断 线 程 。 你 已 经 
看 到 使 用 本 地 工作 队列 如 何 减 少 同步 管理 以 及 洪 在 提高 线程 池 的 吞吐 量 ， 并 且 看 
到 当 等 待 子 任务 完成 时 如 何 运行 队列 中 别 的 任务 来 减少 发 生死 锁 的 可 能 性 。 


我 们 也 考虑 了 许多 方法 来 允许 一 个 线程 中 断 另 一 个 线程 的 处 理 ， 例 如 使 用 特 
殊 中 断 点 和 如 何 将 原本 会 被 中 断 阻塞 的 函数 变 得 可 以 被 中 断 。 


第 10 章 ”多 线程 应 用 的 测试 与 调试 
本 章 主要 内 容 


。 并 发 相关 的 错误 

e. 通过 调试 和 审阅 代码 来 定位 错误 
。 设计 多 线程 的 测试 

。 测试 多 线程 代码 的 性 能 


到 目前 为 止 ， 我 主要 介绍 了 写 并 行 代码 有 哪些 可 用 到 的 工具 ， 怎 么 使 用 它 
们 ， 以 及 代码 的 整体 设计 和 结构 。 本 章 将 要 介绍 软件 开发 的 另 一 个 关键 步 又: 测 
试 和 调试 。 如 果 你 想 通 过 学 习 本 章 来 寻找 测试 并 行 代码 的 一 个 简单 方法 的 话 ， 那 
么 ， 要 让 你 失望 了 。 测 试 和 调试 并 行 代码 是 非常 难 的 。 本 章 主 要 回 你 介绍 一 些 比 
较 常 用 而 且 重 要 的 测试 和 调试 技巧 。 


测试 和 调试 就 相当 于 一 个 硬币 的 两 面 一 一 测试 代码 寻找 错误 ， 调 试 代 码 纠 正 
错误 。 榜 运 的 话 ， 你 自己 调试 出 所 有 的 错误 ， 而 不 是 让 使 用 该 应 用 的 人 发 现代 码 
漏洞 。 在 我 们 介绍 测试 和 调试 之 前 ， 重 要 的 是 理解 可 能 会 出 现 哪些 问题 ， 让 我 们 
先 来 看 看 这 些 问题 。 


10.1 并 发 相关 错误 的 类 型 


在 并 发 代码 中 ， 你 几乎 会 碰 到 任何 类 型 的 错误 ， 但 是 ， 有 些 类 型 的 错误 仅 会 
在 并 发 代码 中 出 现 ， 本 书 仅 关 心 这 些 与 并 发 相关 的 错误 。 这 些 并 发 相关 的 错误 主 
要 分 为 两 大 类 。 


。 DURKEE, 
。 竞争 条 件 。 


这 两 大 类 又 分 为 很 多 小 类 ， 首 先 我 们 来 看 不 必要 的 阻塞 。 
10.1.1 不 必要 的 阻塞 


不 必要 的 阻塞 是 什么 意思 ? 首先 ， 线 性 阻塞 是 指 线程 因为 要 等 待 东 些 条 件 
《如 互 太 元、 条 件 变 量 、 时 间 等 ) 无 法 继续 运行 时 所 处 的 状态 。 多 线程 代码 中 ， 
常用 这 些 条 件 ， 而 这 些 条 件 音 第 无 法 获得 满足 ， 因 此 就 出 现 了 不 必要 的 阻塞 问 
题 。 我 们 接着 又 会 提出 下 一 个 问题 : 为 什么 这 个 阻塞 是 不 必要 的 ? 因为 有 其 他 一 
些 线程 在 等 待 该 阻 豆 的 线程 执行 一 些 动作 ， 如 果 该 线程 阻塞 的 话 ， 其 他 线程 也 势 
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© FE Si 如 第 3 章 所 说 的 ， 死 锁 是 指 第 一 个 线程 在 等 待 第 二 个 线程 执行 后 才能 
继续 ， 而 第 二 个 线程 又 在 等 待 第 一 个 线程 ， 如 此 构成 一 个 线程 等 待 循环 状 
态 。 如 果 你 的 线程 死 锁 了 ， 那 你 的 程序 将 无 法 继续 执行 下 去 。 在 许多 可 以 巴 
见 的 情况 下 ， 多 线程 中 的 某 一 线程 是 负责 与 用 户 接口 交互 的 ， 在 死 锁 情 况 
下 ， 用 户 接口 会 停止 应 答 。 而 在 其 他 情况 下 ， 用 户 接口 仍 会 应 答 ， 只 不 过 有 
些 必要 的 任务 无 法 得 到 执行 ， 如 不 会 返回 搜索 结果 或 者 不 会 打印 文件 等 。 

活 锁 一 当 第 一 个 线程 等 待 第 二 个 线程 时 ， 而 这 第 二 个 线程 又 在 等 第 一 个 线 
程 情况 时 ， 活 锁 类 似 于 死 锁 。 活 锁 与 死 锁 的 关键 不 同 在 于 等 待 过 程 不 是 一 个 
阻塞 状态 而 是 一 个 不 断 的 循环 检测 状态 ， 如 自 旋 锁 。 严 重 时 ， 活 锁 的 症状 就 
像 死 锁 〈 应 用 不 会 执行 任何 进程 ) ， 不 同 仅 在 于 CPU 此 时 的 利用 率 非常 的 
高 ， 因 为 现在 还 在 不 断 的 运行 检测 ， 只 因 相互 等 待 而 阻塞 。 不 太 严 重 时 ， 当 
某 个 随机 事件 发 生 时 ， 活 锁 可 能 会 被 解锁 ， 但 是 ， 活 锁 会 导致 任务 较 长 时 间 
得 不 到 执行 ， 并 且 在 这 期 间 CPU 利 用 率 高 。 

在 VO 或 外 部 输入 上 的 阻塞 一 一 当 你 的 线程 阻塞 是 因为 等 待 某 外 部 输入 而 无 法 
继续 执行 ， 可 能 这 个 外 部 输入 永远 都 不 到 来 ， 那 么 这 种 阻塞 就 称 之 为 基于 等 
待 O 或 其 他 外 部 输入 的 阻塞 。 因 此 ， 不 希望 出 现 一 个 线程 因 等 待 外 部 输入 而 
阻塞 ， 其 他 线程 有 因为 要 等 待 这 个 线程 的 运行 而 阻塞 的 情况 出 现 。 


上 面 简 要 的 介绍 了 几 种 不 必要 的 阻塞 类 型 ， 那 么 什么 是 竞争 条 件 呢 ? 


10.1.2 ”竞争 条 件 


苋 争 条 件 是 多 线程 代码 中 的 问题 最 常见 的 原因 一 一 许多 死 锁 和 活 锁 实际 上 是 
苋 争 条 件 的 表现 。 并 不 是 所 有 的 竞争 条 件 都 是 有 问题 的 一 范 争 条 件 发 生 的 时 间 取 
决 于 各 个 独立 线程 操作 的 先后 顺序 。 许 多 竞争 条 件 是 有 益 的。 例如 ， 到 底 哪 个 线 
程 来 处 理 任务 队列 中 的 下 一 个 任务 是 不 确定 的 。 然 而 ， 许 多 并 发 错误 的 产生 是 由 
于 竞争 条 件 。 竞 争 条 件 凋 常 产 生 下 面 几 种 错误 类 型 。 


。 数据 苑 争 一 一 数据 苑 争 是 一 种 特殊 的 竞争 条 件 。 因 为 没有 同步 好 对 条 个 共享 
内 存 的 并 行 访问 ， 因 此 ， 数 据 竞 争 会 造成 未 定义 的 操作 出 现 。 在 第 5 章 我 们 学 
习 C++ 内 存 模型 时 ， 我 介绍 过 数据 竞争 。 当 错误 地 使 用 原子 操作 来 同步 线程 
或 者 想 通 过 共享 数据 来 避免 互 斥 元 死 锁 时 ， 常 常会 发 生 数 据 范 争 。 
破坏 不 变量 一 一 常常 表现 为 悬挂 指针 《因为 另 一 个 线程 删除 了 被 访问 的 数 
据 ) 、 随 机 存储 损坏 《线程 由 于 局 部 更 新 而 造成 的 读 取 数 据 不 一 致 ) 或 者 双 
朵 状态 〈 如 当 两 个 线程 从 同一 队列 中 弹出 相同 的 值 ， 并 且 这 两 个 线程 因此 而 
删除 一 些 相 关 数 据 ) 等 。 破 坏 不 变量 常 指 不 变量 在 时 间或 数值 上 的 改变 。 如 
果 多 个 线程 要 求 以 特定 的 顺序 执行 ， 那 么 不 正确 同步 可 能 会 产生 由 于 线程 执 
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生存 期 问题 一 一 人 们 常常 会 将 生存 期 问题 归结 为 破坏 不 变量 问题 ， 但 实际 上 
生存 期 间 题 是 竞争 条 件 产生 的 男 一 个 独立 的 问题 分 类 。 在 这 个 分 类 中 的 错误 
的 基本 问题 是 线程 会 超时 访问 某 些 数据 ， 而 这 些 数 据 可 能 已 经 被 删除 、 销 毁 
或 者 访问 的 内 存 其 实 已 经 被 男 一 个 对 象 重 用 。 当 一 个 线程 要 参考 条 一 局 部 变 
量 ， 而 这 个 局 部 变量 已 经 不 在 该 线程 访问 能 力 之 内 了 ， 这 样 束 会 造成 生存 期 
问题 。 当 线程 的 生存 时 间 与 它 可 以 操作 的 数据 之 间 没 有 茶 种 限制 规则 时 ， 那 
么 ， 就 极 有 可 能 出 现在 线程 结束 之 前 该 数据 就 已 被 销毁 ， 而 造成 线程 访问 错 
误 的 问题 。 如 果 在 线程 中 调用 join() 来 让 数据 等 到 线程 完成 后 再 销毁 ， 那 你 
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安全 保障 。 


苋 争 条 件 是 问题 杀手 。 死 锁 和 活 锁 会 导致 任务 长 时 间 得 不 到 执行 。 通 常 ， 你 
d 
是 相互 元 盾 的 。 


在 整个 代码 的 任何 地 方 都 可 能 出 现 上 面 介 绍 的 数据 竞争 、 破 坏 变量 和 生命 周 
期 的 问题 的 症状 〈 如 随机 般 溃 或 者 不 正确 的 输出 ) ， 代 码 可 能 会 重 写 后 面 其 他 程 
序 可 能 会 用 到 的 内 存 ， 导 致 编译 出 错 。 编 译 给 出 的 错误 定位 往往 完全 与 出 错 代码 
无 天 ， 可 在 程序 执行 很 人 人 后， 才能 暴露 该 错误 。 这 类 错误 往往 是 由 共享 系统 内 存 
造成 的 ， 就 算 你 小 心 骂 咖 地 试图 指定 条 线程 访问 茶 数据 ， 并 且 保 证 正确 同步 ， 但 
是 ， 任 何 线程 都 有 可 能 重 写 应 用 程序 中 其 他 线程 需要 使 用 的 数据 。 


人 至此， 我 们 简要 明确 了 我 们 将 要 遇 到 的 错误 类 型 ， 下 面 让 我 们 看 看 ， 我 们 该 
怎样 来 定位 错误 实例 ， 并 解决 它们 。 


10.2 定位 并 发 相关 的 错误 的 技巧 


在 前 面 的 内 容 中 ， 我 们 学 习 了 在 代码 中 可 能 会 遇 到 的 并 发 相关 的 错误 类 型 ， 
以 及 这 些 错误 的 表现 形式 。 对 上 述 知识 有 所 了 解 后 ， 你 可 以 检查 你 的 代码 ， 并 找 
出 错误 可 能 出 现在 哪里 ， 你 可 以 先 答 试 确定 某 段 代码 是 否 有 错 。 


也 许 最 显然 最 直接 的 方法 ， 就 是 查看 代码 。 这 虽然 看 似 明显 ， 但 实际 上 是 很 
难 员 彻 的 。 当 你 阅读 上 自己 刚 写 的 代码 时 ， 很 容易 读 成 你 想 要 写 的， 而 非 你 真正 写 
的 。 相 似 地 ， 如 果 要 你 阅读 他 人 写 的 代码 时 ， 你 快速 阅读 可 能 定位 和 解决 一 些 简 
单 的 问题 ， 一 些 重大 或 比较 隐 星 的 问题 ， 则 需要 我 们 花 大 量 的 时 间 去 梳理 代码 ， 
考虑 可 能 出 现 的 并 行 问题 和 非 并 行 问题 。 在 下 面 的 代码 中 ， 我 们 将 具体 问题 具体 


对 符 。 


就 算是 检阅 你 自己 的 代码 ， 你 还 是 可 能 会 漏 掉 一 些 错误 。 因 此 ， 无 论 何 时 ， 
你 都 要 确保 你 的 代码 可 以 执行 ， 即 使 代码 无 法 顺利 执行 ， 你 也 要 保持 平和 的 心 
态 。 因 此 ， 我 们 会 介绍 一 下 与 检阅 代码 相关 的 一 些 多 线程 测试 和 调试 技巧 。 


10.2.1 审阅 代码 以 定位 潜在 的 错误 


正如 前 面 提 到 的 ， 当 检阅 多 线程 代码 来 纠正 并 行 相关 的 错误 时 ， 彻 底 仔 细 地 
阅读 非常 重要 ， 要 像 一 把 细 具 梳子 一 样 仔细 地 阅读 代码 。 如 果 可 能 让 他 人 帮 你 检 
阅 你 的 代码 ， 因 为 他 们 没有 参与 代码 的 编写 ， 他 们 不 得 不 想 清 楚 代 码 是 如 何 工作 
的 ， 因 此 ， 会 发 现 很 多 遗漏 的 错误 。 这 需要 代码 的 阅读 者 有 充足 的 时 间 来 仔细 人 负 
责 地 检阅 代码 ， 而 不 是 简单 快速 地 过 一 遍 。 大 多 数 并 行 错误 不 是 简单 快速 的 扫 视 
代码 所 能 发 现 的 ， 这 些 错误 往往 需要 微妙 的 时 机 才 会 出 现 。 


如 果 你 让 你 的 同事 帮 你 检阅 你 的 代码 ， 这 个 代码 对 他 来 说 是 完全 陌生 的 。 因 
此 ， 他 们 会 从 不 同 的 视角 来 看 问题 ， 并 指出 一 些 你 未 发 现 的 错误 。 如 果 你 找 不 到 
同事 帮 你 检阅 代码 ， 你 可 以 找 朋 友 帮 忙 ， 甚 至 将 代码 发 到 网 络 上 寻求 帮助 。 如 果 
你 实在 找 不 到 人 帮 你 检阅 代码 ， 或 者 ， 他 们 也 无 法 找 出 问题 ， 别 急 ， 你 还 可 以 这 
么 做 。 对 于 初学 者 来 说 ， 将 代码 搁置 一 段 时 间 ， 去 做 其 他 事情 ， 如 编写 该 程序 的 
其 他 部 分 、 读 书 、 散 步 等 。 在 这 段 时 间 内 ， 当 你 集中 精神 做 其 他 事 时 ， 你 的 潜 意 
识 还 在 想 着 这 个 问题 。 同 时 ， 当 你 重新 回 到 该 代码 时 ， 代 码 已 经 不 那么 熟悉 了 ， 
这 样 你 可 能 就 会 以 一 种 不 同 的 视角 来 检阅 你 的 代码 。 


让 别人 审阅 代码 的 伏 代 方法 是 自己 审阅 。 一 个 有 用 的 技巧 是 试图 解释 它 是 如 
何 工 作 的 细节 给 别人 。 这 个 别人 甚至 可 以 不 是 实体 的 人 ， 如 布 偶 熊 或 橡胶 鸡 ， 我 
个 人 认为 编写 详细 的 注释 极 有 帮助 。 你 要 解释 ， 每 一 行 代码 有 什么 作用 ， 会 发 生 
什么 ， 访 问 的 数据 等 。 你 要 不 断 地 自我 提问 并 解释 回答 。 通 过 不 断 地 问 自 己 这 些 
问题 ， 并 仔细 思考 它 的 答案 ， 问 题 和 常常 自 己 就 会 暴露 出 来 ， 你 会 发 现 这 真是 一 个 
难以 置信 的 发 现 错误 的 有 效 方法 。 这 些 问题 对 于 检阅 任何 代码 都 是 有 用 的 ， 而 不 


仅 对 于 检阅 你 自己 的 代码 。 
审阅 多 线程 代码 时 需要 思考 的 问题 


正如 我 说 的 ， 代 码 阅 读者 在 阅读 代码 时 思考 一 些 与 代码 相关 的 特定 问题 是 非 
常 有 用 的 。 这 些 问题 会 使 阅读 者 集中 注意 力 到 一 些 代码 相关 的 细节 上 ， 并 且 帮 助 
发 现 一 些 潜在 的 错误 。 下 面 列 出 一 些 具 体 的 而 非 全 部 的 ， 我 喜欢 问 的 一 些 问 题 。 
你 也 可 以 找到 其 他 一 些 你 比较 关注 的 问题 。 不 再 多 说 了 ， 先 将 这 些 问题 列 出 以 便 
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。 哪些 数据 是 需要 保护 ， 防 止 并 行 访问 的 ? 

e. 如 何 保 证 你 的 数据 是 被 保护 的 ? 

。 此 时 其 他 线程 执行 到 代码 的 何 处 ? 

该 线程 用 的 是 哪些 信号 量 ? 

其 他 线程 持 有 哪些 信号 量 ? 

该 线程 各 操作 之 间 有 先后 顺序 的 要 求 吗 ? 在 其 他 线程 中 存在 这 样 的 问题 吗 ? 
这 些 要 求 如 何 强制 执行 ? 

该 线程 载 入 的 数据 是 否 有 效 ?该 数据 是 否 已 经 被 其 他 线程 修改 了 ? 

如 果 你 假设 其 他 线程 可 能 正在 修改 该 数据 ， 那 么 可 能 会 导致 什么 样 的 后 果 以 
及 如 何 保证 这 样 的 事情 永 不 发 生 ? 


最 后 一 个 问题 是 我 最 喜欢 问 的 问题 ， 因 为 它 确实 能 帮 有 我 理 清楚 线程 之 间 的 关 
系 。 通 过 假设 茶 行 代码 存在 错误 ， 你 就 可 以 像 个 侦探 一 样 奶 查 原因 。 为 了 说 服 你 
自己 ， 代 码 没有 错误 ， 你 需要 考虑 到 所 有 情况 和 可 能 排序 。 当 数据 在 其 生命 期 内 
受 多 个 信号 量 保护 时 ， 这 个 方法 非常 有 用 ， 例 如 ， 使 用 第 6 章 中 给 出 对 线程 安全 
序列 ， 这 个 安全 的 队列 的 头 和 尾 对 应 不 同 的 信号 量 ， 你 必须 要 保证 线程 持 有 的 马 

个 信号 量 不 会 访问 相同 的 队列 元 素 。 这 个 问题 还 会 使 得 对 公有 数据 或 者 其 他 代 
dE 
明确 。 


列举 的 倒数 第 二 个 问题 同样 也 很 重要 ， 因 为 它 解 决 了 一 个 常常 会 犯 的 简单 错 
误 ， 如 果 你 释放 后 再 重新 获取 该 信号 量 你 必须 假设 其 他 线程 已 经 修改 了 该 共享 数 
据 。 很 明显 ， 如 果 互 斥 锁 因 为 它们 对 于 对 象 来 说 是 内 部 的 不 是 立即 可 见 的 一 你 可 
能 在 不 知 不 觉 中 就 那么 做 了 。 在 第 6 半 中 ， 可 以 看 到 当 函 数 提供 线程 安全 数据 结 
构 时 太 细 粒度 的 时 候 ， 是 如 何 导 致 竞争 条 件 以 及 错误 的 。 但 是 ， 对 于 一 个 非 线 程 
安全 的 栈 来 说 ， 栈 可 能 会 被 多 个 线程 并 行 访问 ， 让 top( ) 和 pop( ) 操 作 独 立 开 来 
是 必要 的 ， 那 么 ， 共 享 数据 被 修改 的 情况 将 不 再 会 出 现 ， 因 为 内 部 互 斥 元 的 锁 在 
这 两 个 调用 之 间 束 已 经 被 释放 了 ， 因 此 ， 男 一 个 线程 就 可 以 修改 栈 了 。 第 6 章 
中 ， 解 决 的 办 法 是 将 两 个 操作 结合 起 来 ， 所 以 它们 都 在 同一 互 斥 锁 的 保护 下 执 
行 ， 从 而 消除 了 潜在 的 范 争 条 件 。 


那么 ， 让 我 们 来 回顾 一 下 你 自己 的 代码 (或 者 他 人 的 代码 ) ， 你 要 确保 没有 
代码 错误 。 你 该 怎样 测试 你 的 代码 确保 无 错 或 人 否定 你 代码 无 错 的 信念 ， 只 有 试 过 


才 知 道 。 
10.2.2 ”通过 测试 定位 并 发 相关 的 错误 


开发 单线 程 应 用 时 ， 应 用 测试 比较 简单 耗 时 。 首 先 ， 你 需要 区 分 所 有 可 能 的 
输入 数据 集 (至 少 包括 一 些 典 型 的 输入 测试 集 ) 并 且 对 这 些 输入 数据 集 进 行 测 
试 。 如 果 应 用 程序 能 够 正确 执行 并 且 产 生 正 确 的 输出 ， 说 明 这 个 应 用 程序 对 于 给 
定 的 输入 集 能 够 正常 运行 。 如 果 测 试 到 错误 状态 ， 处 理 则 会 比 正确 运行 的 情况 复 
杂 。 但 是 ， 基 本 思想 是 相同 的 一 一 建立 初始 化 条 件 执行 应 用 程序 。 


测试 多 线程 代码 相对 于 单线 程 来 说 难得 多 ， 因 为 合理 的 调度 线程 是 不 确定 
的 ， 因 此 线程 调度 的 差异 会 导致 运行 的 变化 。 因 此 ， 即 使 应 用 程序 运行 同一 组 输 
入 数据 ， 如 果 代 码 中 潜伏 有 竞争 条 件 的 话 ， 仍 然 有 可 能 会 导 臻 有 时 运行 正确 有 时 
ene 仅仅 是 有 时 有 
可 能 会 失败 。 


鉴于 固有 的 难以 再 现 并 发 相关 的 错误 ， 因 此 ， 需 要 仔细 地 设计 测试 程序 。 你 
希望 每 次 测试 能 够 确定 问题 可 能 存在 的 最 少 的 代码 ， 那 么 当 测 试 失败 时 ， 你 就 可 
以 更 好 地 隔离 出 错 代码 一 一 测试 并 行 队列 最 好 能 够 直接 测试 并 行 压 栈 和 出 栈 工 作 
而 不 是 测试 使 用 并 行 队列 的 整个 代码 块 。 这 样 有 助 你 思考 该 怎样 设计 测试 代码 
参考 本 章 后 面 的 易 测 性 设计 小 节 中 的 内 容 。 


我 们 值得 通过 测试 消除 并 发 来 证 明 问题 是 并 发 相关 的 。 如 果 你 让 所 有 程序 运 
行 在 一 个 线程 时 出 错 ， 该 错 只 是 一 个 普通 的 错误 而 非 一 个 并 发 相关 的 错误 。 妃 踊 
错误 的 初始 发 生 位 置 而 不 是 被 你 的 测试 工具 测试 发 现 的 错误 位 置 是 非常 重要 的 。 
这 是 因为 即使 错误 发 生 在 你 应 用 的 多 线程 部 分 ， 也 并 不 意味 着 它 就 是 并 发 相关 
的 。 如 果 你 使 用 线程 池 来 管理 并 发 等 级 ， 通 常 你 可 以 通过 设置 配置 参数 来 指定 工 
作 线 程 。 如 果 你 手动 地 管理 线程 ， 你 就 需要 修改 代码 以 便 使 用 单个 线程 测试 来 进 
行 测试 。 一 方面 ， 你 可 以 将 你 的 线程 减少 到 一 个 ， 这 样 就 可 以 根除 并 发 ， 男 一 方 
面 ， 如 果 在 单 核 系 统 中 没有 错误 即使 是 一 个 多 线程 应 用 ) ,但 是 在 多 核 系 统 或 
多 处 理 器 系统 中 出 错 ， 那 么 就 是 竞争 条 件 错误 和 可 能 同步 或 内 存 顺序 错误 。 


比 代 码 结构 更 加 重要 的 是 测试 代码 的 并 发 性 ， 测 试 代码 的 结构 仅仅 跟 测 试 环 
境 一 样 重要 。 如 果 你 连续 用 一 个 测试 实例 来 测试 并 发 队列 ， 你 需要 考虑 以 下 各 种 
不 同 的 应 用 场景 。 


e 一 个 线程 在 自身 队列 上 调用 push() 或 pop() 来 验证 该 队列 工作 在 基础 级 别 。 
。 在 一 个 空 队 列 上 一 个 线程 调用 push() 同 时 另 一 个 线程 调用 pop() 。 

。 在 一 个 空 队列 上 多 个 线程 调用 push()。 

。 在 一 个 满 队列 上 多 个 线程 调用 push( ) 。 

。 在 一 个 空 队列 上 多 个 线程 调用 pop()。 

。 在 一 个 满 队列 上 多 个 线程 调用 pop()。 

。 在 一 个 特定 的 满 队 列 上 多 个 线程 调用 pop()， 该 队列 的 总 长 度 不 够 ， 无 法 满 


足 所 有 线程 。 
。 在 一 个 空 队列 上 同时 有 多 个 线程 调用 push() 和 一 个 线程 调用 pop() 。 
。 在 一 个 满 队列 上 同时 有 多 个 线程 调用 push() 和 一 个 线程 调用 pop() 。 
。 在 一 个 空 队列 上 同时 有 多 个 线程 调用 push() 和 多 个 线程 调用 pop()。 
。 在 一 个 满 队列 上 同时 有 多 个 线程 调用 push( ) 和 多 个 线程 调用 pop()。 
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e 在 每 个 场景 中 ， 多 线程 是 什么 意思 G. 4. 1024? ) 。 
。 系统 是 否 有 足够 的 处 理 核 来 为 每 个 运行 线程 分 配 一 个 核 。 
。 测试 程序 需要 在 哪 种 结构 的 处 理 器 上 运行 。 

。 你 将 怎样 为 你 测试 的 并 行 部 分 确定 合适 的 时 间 顺 序 。 


对 于 特殊 情况 需要 考虑 附加 因子 。 鉴 于 对 以 上 四 种 环境 的 考虑 ， 第 一 种 和 最 
后 一 种 环境 会 影响 测试 代码 自身 的 结构 〈 参 见 10.2.5 节 ) ， 其 他 两 种 与 正在 使 用 
的 物理 测试 系统 有 关 。 使 用 到 的 线程 数 与 特定 的 被 测试 代码 有 关 ， 但 是 ， 可 以 通 
过 构建 测试 代码 的 不 同 的 方式 来 得 到 合理 的 时 间 顺 序 表 。 在 我 们 学 习 这 些 技术 之 
前 ， 让 我 们 来 看 看 怎样 设计 一 个 便于 测试 的 应 用 代码 。 


10.2.3 ”可 测试 性 设计 


测试 多 线程 代码 是 困难 的 ， 所 以 你 会 想 怎样 才能 使 代码 易于 测试 呢 ? 你 能 做 
的 最 重要 的 事情 之 一 就 是 设计 易于 测试 的 代码 。 现 有 设计 易于 测试 代码 的 技术 大 
都 用 于 单线 程 代 码 ， 但 是 ， 其 中 许多 技术 也 同样 可 以 应 用 多 线程 。 通 常 ， 做 到 以 
下 几 点 后 ， 代 码 就 比较 易于 测试 了 。 


。 每 个 函数 功能 和 类 的 划分 清晰 明确 。 
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e. 你 的 测试 代码 可 以 完全 控制 你 的 被 测试 代码 的 周围 的 环境 。 

e. 被 测试 的 需要 特定 操作 的 代码 应 该 集中 在 一 块 而 不 是 分 散在 整个 系统 中 。 
。 在 你 写 测试 代码 之 前 你 要 先 考虑 如 何 测 试 代码 。 


所 有 以 上 提 到 的 都 可 以 应 用 在 多 线程 代码 中 。 事 实 上 ， 我 认为 上 述 几 点 更 多 
的 应 用 于 解决 多 线程 代码 的 易 测 性 而 非 单 线程 代码 的 易 测 性 。 上 述 最 后 一 条 非常 
重要 ， 即 使 你 编写 应 用 代码 之 前 ， 此 时 还 远 没 有 到 写 测 试 代码 的 那 一 步 ， 在 你 编 
写 应 用 代码 之 前 也 有 必要 考虑 怎样 测试 它 一 一 使 用 什么 样 的 输入 ， 哪 些 条 件 下 可 
能 会 出 错 ， 怎 样 找到 代码 潜在 的 错误 等 。 


设计 易于 测试 的 并 行 代码 最 好 的 方法 之 一 就 是 消除 并 发 。 如 果 你 可 以 将 代码 
分 割 成 多 个 部 分 ， 在 一 个 单线 程 内 由 这 些 部 分 来 负责 要 操作 的 通信 数据 与 多 个 线 
程 之 间 的 通信 路 径 ， 这 样 ， 你 就 极 大 地 减少 了 问题 。 操 作 被 一 个 单线 程 访问 的 数 
据 时 的 这 些 应 用 部 分 可 以 使 用 正常 的 单线 程 技术 来 进行 测试 。 这 样 ， 那 些 难以 测 


试 的 用 于 处 理 线 程 之 间 通 信和 确保 一 个 时 间 内 仅 有 一 个 线程 访问 特定 数据 块 的 并 
发 代码 部 分 就 变 得 比较 少 ， 测 试 出 现 错误 时 ， 也 更 加 容易 进行 妃 踪 错误 源头 。 


例如 ， 如 果 你 的 应 用 被 设计 成 一 个 多 线程 的 的 状态 机 ， 那 么 你 就 可 以 将 它 分 
解 成 多 个 部 分 。 用 于 为 每 个 可 能 的 输入 集 确保 状态 转换 和 操作 的 正确 性 的 线程 的 
状态 逻辑 可 以 通过 单线 程 技术 独 立 的 进行 测试 ， 并 且 通 过 测试 工具 提供 的 测试 输 
入 集 ， 可 以 同样 应 用 到 其 他 线程 。 接 着 ， 通 过 测试 代码 中 特别 设计 多 并 发 线程 和 
简单 的 状态 逻辑 ， 核 心 状态 机 和 确保 各 事件 按 正 确 的 顺序 到 达 正 确 的 线程 的 信息 
路 由 的 代码 可 以 独立 的 进行 测试 。 


可 选 地 ， 如 果 你 将 代码 分 解 成 多 个 代码 块 ， 读 共享 数据 /迁移 数据 /更 新 共享 
数据 ， 你 可 以 使 用 所 有 的 单线 程 技术 来 测试 迁移 数据 代码 块 部 分 ， 因 为 此 时 这 部 
分 代码 仅 是 一 个 单线 程 代码 。 测 试 一 个 多 线程 迁移 困难 的 问题 可 以 降级 为 测试 读 
共 至 数据 块 和 更 新 共 译 数据 块 中 的 一 个 ， 哪 个 简单 选 哪 个 。 


需要 注意 的 是 库 函 数 调用 能 够 使 用 内 部 变量 来 存储 状态 ， 然 后 ， 如 果 多 个 线 
程 使 用 相同 的 库 冰 数 调用 集 在 多 线程 之 间 实 现 共享 。 因 为 代码 访问 共享 数据 不 是 
立即 表现 出 来 的 ， 因 此 ， 多 线程 的 共享 还 存在 一 些 问题 。 然 而 ， 随 着 你 对 这 些 库 
函数 调用 的 学 习 ， 多 线程 共享 仍然 是 个 问题 。 这 时 ， 你 要 么 添加 适当 的 保护 和 同 
步 或 者 使 用 可 符 代 的 对 于 多 线程 的 并 行 访问 来 说 安全 函数 。 


设计 多 线程 的 易 测 性 比 你 构建 代码 以 减少 用 来 处 理 并 发 相关 的 问题 代码 和 注 
意 对 于 一 些 非 线 程 安全 的 库 函 数 调 用 代码 的 代码 量 来 说 更 为 重要 。 在 浏览 代码 
时 ， 记 得 问 一 下 上 自己 10.2.1 小 节 中 的 问题 是 非常 有 用 的 。 尽 管 这 些 问题 可 能 不 是 
直接 关于 测试 或 易 测 性 的 ， 但 是 ， 如 果 你 事先 在 你 的 测试 代码 中 考虑 到 上 述 问 题 
人 


既然 我 们 学 习 了 合理 的 设计 代码 可 以 使 测试 变 得 更 加 容易 ， 潜 在 地 修改 代码 
来 从 “单线 程 部 分 ”( 这 个 单线 程 仍 可 以 通过 并 发 模块 与 其 他 线程 进行 交互 ) 隔 
离 “ 并 发 部 分 ”( 比如 线程 安全 容器 或 状态 机 事件 逻辑 ) ， 下 和 面 让 我 们 来 学 习 测 试 
并 发 代码 的 相关 技术 。 


10.2.4 多 线程 测试 技术 

你 需要 思考 你 想 要 测试 的 场景 并 且 编写 一 些小 的 代码 来 测试 函数 功能 。 那 
么 ， 你 怎样 确保 那些 存在 潜在 的 问题 的 时 间 调 度 通过 小 的 测试 练习 解决 它 的 潜在 
并 误 呢 ? 

事实 上 ， 有 许多 方法 可 以 做 到 这 点 ， 如 骏 力 测试 或 者 压力 测试 。 
1. IMA (brute-force testing) 


其 力 测 试 的 核心 思想 是 穷 举 所 有 可 能 情况 看 代码 是 否 能 够 正常 而 不 出 现 错 
误 。 最 典型 的 方法 是 多 次 运行 代码 ， 并 且 尽 可 能 地 一 次 运行 多 个 线程 。 如 果 一 个 
错误 仅 在 多 个 线程 以 某 一 特定 顺序 运行 时 出 现 ， 那 么 运行 的 代码 越 多 ， 出 错 的 可 
能 性 就 越 大 。 如 果 你 仅 测 试 一 次 并 且 通 过 了 测试 ， 你 可 能 自信 地 以 为 代码 没有 问 
题 ， 能 够 工作 。 如 果 你 一 批 运行 十 次 并 且 每 次 都 能 通过 测试 ， 你 就 会 更 加 上 自信。 
如 果 你 测试 了 十 亿 次 ， 并 且 每 次 都 通过 测试 ， 那 你 就 会 对 你 的 代码 自信 无 比 。 


你 的 自信 程度 取决 于 你 通过 测试 的 次 数 。 如 果 你 的 测试 结果 非 第 精确， 测试 
甚至 可 以 精确 地 概括 到 线程 安全 队列 的 话 ， 这 样 的 穷 举 测试 会 让 你 对 自己 的 代码 
无 比 自 信 ; 男 一 方面 ， 如 果 被 测试 的 代码 非常 的 多 ， 可 能 的 排列 数 非常 多 ， 运 行 
即使 十 亿 次 也 仅 会 产生 一 点 点 自信 。 


穷 举 测 试 的 缺点 是 它 可 能 会 让 人 产生 盲目 的 自信 。 可 能 你 编写 的 测试 环境 不 
会 产生 错误 ， 就 算 你 运行 多 次 也 不 会 出 现 错误 ， 但 是 ， 换 一 个 稍微 不 同 的 环境 就 
会 每 次 测试 都 出 错 。 最 坏 的 情况 就 是 在 你 的 测试 系统 中 不 会 出 现 有 问题 的 测试 环 
境 因为 你 测试 是 在 一 个 特殊 的 环境 。 除 非 你 的 代码 运行 的 环境 与 你 代码 测试 运行 
的 环境 一 模 一 样 ， 并 且 相 应 的 硬件 和 操作 系统 也 不 会 引起 任何 错误 出 现 。 


这 里 给 出 的 一 个 典型 的 例子 就 是 在 一 个 单 处 理 系 统 上 测试 一 个 多 线程 应 用 。 
因为 每 个 线程 都 要 求 运行 在 同一 个 处 理 器 上 ， 所 有 的 任务 都 是 自动 串 行进 行 的 ， 
那么 在 多 处 理 器 上 可 能 遇 到 的 许多 竞争 条 件 和 双向 缓存 问题 在 单 处 理 器 系统 中 都 
不 复 存 在 了 。 这 不 仅仅 是 变量 的 问题 ; 不 同 的 处 理 器 体系 结构 产生 不 同 的 同步 和 
设备 时 序 问题 。 例 如 ， 在 x86 和 x86-64 体 系 结构 上 ， 自 动 加 载 的 操作 通常 是 一 样 
的 ， 但 是 是 否 标 识 memory_order_relaxed 或 者 memory_order_seq_cst 是 不 同 
的 《参见 5.3.3 节 ) 。 这 意味 痢 那些 编写 的 代码 可 以 在 放松 内 存 顺序 的 x86 系 统 上 
正确 运行 ， 而 在 有 着 精确 时 序 操 作 指 令 集 系统 如 SPARC 系 统 中 会 运行 失败 。 


如 果 你 需要 你 的 应 用 能 够 方便 的 在 多 个 目标 系统 运行 ， 那 么 在 这 多 种 系统 上 
进行 一 些 有 代表 性 实例 的 测试 是 非常 重要 的 。 这 就 是 我 为 什么 在 10.2.2 节 测试 环 
境 中 列 出 被 使 用 的 处 理 器 体系 结构 的 原因 。 

避免 潜在 的 盲目 自信 的 关键 是 成 功 地 进行 穷 举 测试 。 这 需要 仔细 考虑 测试 设 
计 ， 不 仪 考虑 与 被 测 代码 单元 的 选择 ， 还 要 考虑 测试 工具 的 设计 和 选择 测试 环 
境 。 你 需要 保证 尽 可 能 多 的 方法 测试 代码 ， 也 要 尺 可 能 考虑 所 有 可 行 的 线程 交 
互 。 


尽管 穷 举 测试 确 实 能 给 你 带 来 自信 ， 但 是 ， 穷 举 测 试 无 法 保证 找到 所 有 问 
题 。 这 里 介绍 一 种 可 以 找到 所 有 问题 的 技术 ， 我 们 称 之 为 组 合 仿真 测试 。 这 种 测 
试 技术 要 求 你 花 时 间 将 它 应 用 到 你 的 代码 和 合适 的 软件 中 去 。 


2. 组 合 仿真 测试 


这 有 点 绕 嘴 ， 因 此 我 最 好 先 解释 一 下 我 的 意思 。 组 合 仿真 测试 是 指 在 一 种 特 
殊 的 仿真 代码 真实 运行 环境 的 软件 上 运行 你 的 代码 。 你 将 注意 到 这 个 软件 允许 你 


在 一 个 单 物理 计算 机 上 运行 多 个 虚拟 机 ， 这 些 虚拟 机 和 硬件 的 特性 是 被 上 层 软 件 
范 争 调用 。 不 同 于 仿真 系统 ， 模 拟 软 件 能 够 记录 线程 数据 访问 、 锁 、 原 子 操作 等 
的 先后 顺序 。 然 后 ， 使 用 C++ 内 存 模型 的 规则 重复 运行 每 组 允许 的 组 合 操作 来 识 
别 竞 争 条 件 和 和 死 锁 。 


虽然 如 此 全 面 的 测试 组 合 能 够 保证 找到 系统 中 的 所 有 错误 ， 但 是 ， 许 多 小 的 
错误 ， 往 往 需 要 花费 大 量 的 时 间 来 发 现 它 ， 因 为 组 合 操作 的 排列 数 会 随 着 线程 数 
和 每 个 线程 的 操作 数 增 长 而 呈现 指数 增长 的 趋势 。 因 此 组 合 测试 技术 最 好 保留 到 
对 代码 片段 进行 精细 测试 时 再 用 ， 而 不 是 应 用 对 整个 应 用 程序 的 测试 。 组 合 测试 
的 一 个 明显 的 缺点 就 是 它 需 要 依赖 于 仿真 软件 处 理 你 代码 中 操作 的 能 力 。 


组 合 测试 技术 可 以 用 来 在 正常 条 件 下 反复 测试 你 的 代码 ， 但 是 ， 这 种 技术 可 
能 会 漏 查 一 些 错误 ， 因 此 ， 你 需要 一 种 技术 ， 这 种 技术 可 以 让 你 在 各 种 特定 的 条 
件 下 反复 测试 你 的 代码 。 有 这 样 一 种 技术 存在 吗 ? 


使 用 在 测试 运行 时 发 现 问 题 的 库 函 数 就 是 这 样 一 种 技术 。 
3. 使 用 特殊 的 库 函 数 来 检测 测试 暴露 出 的 问题 


尽管 这 种 技术 无 法 提供 全 面 检查 组 合 的 模拟 测试 ， 但 是 ， 你 可 以 使 用 一 些 特 
别 的 库 函 数 同步 基本 单元 来 找到 大 部 分 错误 ， 这 些 同 步 基 本 单元 如 互 斥 元 、 锁 和 
条 件 变量 等 。 例 如 ， 常 用 的 要 求 对 一 块 共享 数据 使 用 互 斥 锁 。 当 你 访问 数据 时 ， 
如 果 检 测 到 互 斥 锁 ， 就 可 以 证 实 当 访问 数据 时 ， 调 用 线程 已 将 该 互 斥 元 锁 住 了 并 
且 报告 访问 失败 。 通 过 标记 你 的 共享 数据 ， 你 可 以 使 用 库 函 数 来 检查 数据 共享 。 

如 果 有 一 个 特殊 线程 一 次 拥有 多 个 互 斥 元 ， 应 用 库 函 数 还 可 以 记录 锁 的 顺 
序 。 如 果 另 一 个 线程 在 不 同 的 时 序 锁 住 该 互 斥 元 ， 即 使 测试 运行 时 没有 出 错 ， 也 
会 将 之 标记 成 一 个 可 能 的 死 锁 。 

测试 多 线程 的 男 一 类 特殊 的 库 函 数 是 通过 多 个 线程 中 将 获得 锁 的 那个 线程 或 
者 通过 notify_one() 函 数 调 用 一 个 将 态 变 量 的 线程 的 控制 权 交 给 测试 人 员 来 实 
现 线程 的 原子 属性 ， 如 互 斥 元 和 条 件 变量 。 这 样 可 以 让 你 建立 特定 的 测试 场景 并 
且 验 证 代码 在 这 些 特定 场景 内 是 否 能 顺利 运行 。 


此 外 ， 在 C++ 标准 库 函 数 中 也 有 一 部 分 可 用 于 测试 的 库 函 数 ， 我 们 可 以 在 我 
们 的 测试 工具 中 调用 这 些 标准 库 函 数 。 


看 完 执行 测试 代码 的 不 同方 式 之 后 ， 现 在 我 们 来 看 看 构建 测试 代码 来 实现 你 
希望 的 调度 顺序 的 方法 。 


10.2.5 构建 多 线程 的 测试 代码 
前 面 的 10.2.2 节 中 ， 我 告诉 大 家 你 要 找到 方式 来 为 你 测试 程序 的 “while” 部 分 


提供 某 种 可 行 的 调度 顺序 ， 下 面 我 们 将 要 学 习 在 这 一 过 程 会 遇 到 的 问题 。 


基本 的 问题 是 ， 你 需要 安排 一 组 线程 ， 这 组 线程 中 的 每 个 线程 在 你 指定 的 时 
间 内 都 可 以 执行 一 段 选 定 的 代码 。 最 常见 的 情况 是 ， 你 有 两 个 线程 ， 但 是 这 可 以 
很 容易 地 扩展 到 更 多 。 在 第 一 步 中 ， 你 需要 区 分 每 个 测试 的 不 同 的 部 分 。 


通用 的 启动 代码 需要 在 所 有 代码 之 前 局 动 的 那 段 代码 。 
线程 特定 的 启动 代码 必须 在 每 个 线程 上 启动 的 那 段 代码 。 
每 个 线程 的 实际 代码 是 指 你 希望 并 行 运行 的 那 段 代码 。 
在 并 行 执行 完成 后 运行 的 那 段 代码 ， 包 括 代码 状态 的 断言 。 


为 了 更 进一步 解释 ， 我 们 来 看 看 10.2.2 节 的 测试 列表 执行 一 个 特定 的 例子 ， 
一 个 线程 用 于 对 一 个 空 队列 调用 push()， 男 一 个 线程 则 用 于 调用 pop()。 


通用 启动 代码 很 简单 ， 就 是 你 必须 创建 队列 。 执 行 pop( ) 的 线程 没有 线程 特 
定 的 启动 代码 。 而 对 于 执行 push( ) 函 数 的 线程 来 说 ， 它 的 线程 特定 的 启动 代码 依 
赖 于 队列 的 接口 和 存储 对 象 的 类 型 。 如 果 将 要 存储 的 对 象 很 难 构建 或 者 必须 是 堆 
分 配 的 ， 那 么 ， 你 可 以 将 这 个 存储 对 象 的 构建 过 程 或 堆 分 配 过 程 作为 线程 特定 的 
局 动 代码 ， 这 样 存储 对 象 的 构建 过 程 或 堆 分 配 过 程 就 不 会 影响 你 的 测试 了 。 相 
反 ， 队 列 仅 存储 普通 的 int 类 型 ， 那 么 就 不 需要 在 启动 代码 中 构建 nt 型 。 被 测试 
的 实际 代码 是 相当 明确 的 一 一 就 是 对 push() 和 pop() 的 调用 。 那 么 ， 在 这 个 例子 
中 ， 哪 个 是 “结束 后 ”的 代码 部 分 呢 ? 


在 这 个 例子 中 ， 那 段 “结束 后 ”的 代码 部 分 就 取决 于 你 希望 用 pop( ) 函数 来 做 
什么 。 如 果 你 用 它 来 阻塞 线程 直到 队列 有 数据 为 止 ， 那么， 你 可 以 明确 “结束 
后 ”代码 获取 向 push( ) 函 数 提供 的 返回 数值 和 队列 置 空 。 如 果 pop() 不 用 于 阻塞 
线程 ， 并 且 在 队列 为 空 时 结束 ， 那 么 你 需要 测试 两 种 可 能 性 ， 要 么 pop( ) 函数 返 
回 癌 push( ) 函 数 提供 的 数据 ， 要 么 队列 为 空 或 者 pop () 函 数 指示 没有 数据 并 且 队 
列 中 有 一 个 元 素 。 当 其 中 的 任意 一 种 可 能 性 为 真 时 ， 你 希望 避免 的 是 场景 
是 pop() 函 数 显 示 “ 没 有 数据 ”而 且 队 列 是 空 的 ， 或 者 pop() 函 数 返 回 值 ， 但 是 ， 队 
列 却 仍然 不 为 空 。 为 了 简化 测试 ， 假 设 你 有 一 个 阻塞 pop() 函 数 。 那 么 最 后 的 代 
码 就 是 出 队列 的 数据 即 为 进 队 列 的 数据 ， 并 且 队 列 为 空 。 


至 此 ， 我 们 已 经 区 分 了 代码 的 不 同 部 分 ， 接 着 你 就 要 尽量 让 一 切 代码 都 按 计 
划 运 行 。 一 个 可 行 的 办 法 是 使 用 一 系列 的 std: :promises 来 指示 一 切 就 纤 。 每 个 
线程 设置 一 个 promise 来 指示 该 线程 已 准备 就 绪 ， 接 着 等 竺 从 第 三 方 
std: :promise 获 得 的 一 个 〈 或 者 一 个 副本 ) std::shared future; 主线 程 等 待 
所 有 线程 的 所 有 promise 被 设置 ， 然 后 控制 这 些 线程 运行 。 这 就 保证 了 在 并 行程 序 
运行 之 前 每 个 线程 都 已 被 启动 ， 任 意 线程 特定 的 启动 代码 必须 在 线程 的 promise 设 
置 之 前 就 被 执行 。 最 后 ， 主 线程 要 等 待 所 有 线程 结束 并 检查 最 终 的 状态 。 你 同时 
还 需要 注意 线程 异常 还 确保 不 会 有 任意 一 个 线程 需要 等 得 还 未 发 生 的 操作 信号 。 
清单 10.1 给 出 了 这 个 例子 的 测试 代码 。 


清单 10.1 队列 上 当前 调用 的 push0 和 pop0 的 测试 例子 


void test concurrent push and pop on empty queue () 


{ 


threadsafe_queue<int> q; 0 
std::promise«void» go,push ready, pop ready; O 
std::shared future<void> ready(go.get future()); < (3) 
std::future<void> push done; 0O 
std::future«int» pop done; 
CEY 
{ 
push done=std: :async (std: : launch: :async, +@ 
[&q, ready, &push_ready] () 
{ 
push_ready.set_value(); 
ready.wait (); 
q.push(42}; 
} 
}; 
pop done-std::async(std::launch::async, 0O 
[&q, ready, &pop ready] () 
{ 
pop ready.set value(); 
ready.wait(); 
return q.pop(); EE 7) 
j 
3 
push ready.get future().wait(); -© 


pop ready.get future().wait(); 


go.set value(); -© 


push done.get(); «—D 
assert (pop done.getí()--42); «p 
assert (q.empty()); 


j 


catch(...) 


{ 
go.set value(); «p 


throw; 


这 一 结构 很 好 地 呼应 了 我 们 前 面 的 介绍 。 首 先 ， 创 建 空 队列 ， 这 部 分 作为 通 
用 启动 代码 @。 然 后 ， 为 所 有 “就 绪 * 信 号 创建 各 自 的 promise@， 并 且 为 go 信号 获 
取 一 个 std: :shared future 合 。 接 下 来 ， 你 可 以 创建 future 来 表示 线程 已 经 运行 
结束 全。 这 些 需 要 程序 跳 转 到 try 模 块 之 外 ， 这 样 你 就 可 以 为 异常 设置 go 信号 而 
无 需 等 待 测试 线程 运行 结束 《因为 在 测试 代码 可 能 出 现 死 锁 一 将 死 锁 限制 在 测试 
代码 内 部 是 一 种 相当 理想 的 情况 ) 。 


在 try 模 块 内 部 你 可 以 启动 线程 @、@ 一 一 你 可 以 使 用 std: :lanch: :async 
来 保证 任务 在 其 各 自 的 线程 上 运行 。 注 意 使 用 std: :async 可 以 你 的 异常 安全 任 
务 相 比 于 使 用 普通 的 std: :thread 来 说 更 为 简单 ， 这 是 因为 future 的 析 构 函数 在 整 
个 线程 执行 过 程 中 都 会 加 入 该 线程 。Lambda 捕 获 详细 说 明 每 个 任务 都 会 参考 队列 
和 相关 的 promise 已 就 绪 信 号 ， 并 且 将 从 gopromise 中 复制 readyfuture。 


如 上 所 述 ， 每 个 任务 设置 它 自己 的 ready 信 号 ， 然 后 ， 在 运行 时 间 测 试 代码 
之 前 等 待 通用 ready 信 号 。 主 程序 的 过 程 与 之 相反 一 在 设置 信号 来 局 动 真 正 的 测 
OZ HGS OK H TATE SO. 


最 终 ， 主 线程 从 异步 调用 中 去 调用 future 上 的 get( ) 来 等 待 任务 的 完成 @@、@ 
和 检查 结果 。 注 意 pop 任 务 通过 future 来 返回 检索 值 @， 因 此 ， 你 可 以 使 用 它 来 获 
Aur zi mes me. 
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的 回收 器 会 在 任务 未 就 绪 时 等 待 任 务 完成 。 


虽然 这 似乎 是 相当 多 的 样板 只 是 为 了 测试 两 个 简单 的 调用 ， 有 必要 使 用 一 些 
类 似 的 测试 以 实现 在 最 好 的 测试 时 机 测试 你 真正 想 要 的 部 分 。 例 如 ， 实 际 的 线程 
启动 可 能 是 一 个 非常 耗 时 的 过 程 ， 因 此 ， 如 果 你 不 让 线程 等 待 go 信号 ， 那 么 ， 
push 线 程 就 会 在 pop 线 程 启动 之 前 就 已 经 完成 了 ， 这 样 就 完全 错过 了 测试 时 机 。 使 
用 future 确 保 了 两 个 线程 在 相同 的 future 上 运行 和 阻塞 。 解 除 future 阻 塞 允 许 两 个 线程 
同时 运行 。 一 旦 你 对 该 结构 熟悉 后 ， 你 很 容易 就 可 以 在 该 模式 上 直接 创造 出 新 的 
测试 代码 。 该 模式 也 可 以 很 容易 地 扩展 到 多 个 线程 的 测试 。 


至 此 ， 我 们 已 经 学 习 了 多 线程 代码 的 正确 性 。 尽 管 多 线程 代码 的 正确 性 是 一 
个 很 重要 的 问题 ， 但 它 不 是 你 进行 测试 的 唯一 理由 。 测 试 多 线程 代码 的 性 能 也 同 
样 重 要 ， 这 部 分 我 们 将 会 在 下 节 介 绍 。 


10.2.6 ”测试 多 线程 代码 的 性 能 
在 应 用 程序 中 使 用 并 行 的 一 个 主要 原因 是 为 了 充分 利用 现在 流行 的 多 核 处 理 


强 来 提高 应 用 程序 的 性 能 。 因 此 ， 实 际 测 试 你 的 代码 确认 性 能 确实 得 到 提升 ， 殊 
像 你 对 应 用 程序 尝试 了 其 他 性 能 优化 一 样 。 


使 用 并 行 提 高 性 能 将 会 带 来 一 个 特殊 的 扩展 性 问题 一 一 你 可 能 希望 在 24 核 机 
器 上 代码 运行 速度 是 在 单 核 机 器 上 的 24 倍 ，24 个 核 是 平等 的 。 你 不 希望 代码 运行 
在 24 核 上 的 速度 仅仅 是 双核 机 器 上 的 两 倍 。 回 顾 8.4.2 小 节 ， 如 果 你 代码 中 重要 部 
分 代码 仅 在 一 个 线程 上 运行 ， 会 限制 代码 潜在 的 性 能 收益 。 因 此 ， 有 必要 在 你 开 
台 测 试 前 查看 你 代码 的 整体 设计 ， 你 会 知道 你 是 否 能 够 获得 24 倍 的 性 能 提升 ， 或 
者 你 代码 的 一 系列 整体 设计 和 架构 限制 你 的 代码 仅 能 获得 3 倍 的 性 能 。 


就 像 你 在 前 面 章节 所 看 到 的 ， 进 程 之 间 竞 争 访问 的 数据 会 极 大 地 影 啊 性 能 。 
然而 ， 当 处 理 器 的 数目 少时 ， 可 能 系统 性 能 较 好 ， 而 当 处 理 器 数目 较 多 时 ， 系 统 
性 能 反而 很 差 ， 因 为 处 理 器 的 数目 多 了 ， 苋 争 也 就 多 了 。 


因此 ， 当 测试 多 线程 代码 的 性 能 时 ， 最 好 先 检测 多 种 不 同 配置 下 的 系统 性 
能 ， 由 此 你 能 评估 出 系统 性 能 扩展 能 力 。 至 少 ， 你 该 测试 下 单 处 理 器 系统 和 多 处 
理 器 系统 下 的 性 能 。 


10.3 总结 


在 本 章 ， 我 们 学 习 了 各 种 你 可 能 会 碰 到 的 与 并 行 相关 的 错误 类 型 ， 如 死 锁 活 
锁 、 数 据 竞 争 和 其 他 问题 的 竞争 条 件 等 。 接 着 ， 我 们 又 介绍 了 定位 这 些 错误 的 一 
些 技巧 。 这 些 技巧 包括 : 代码 检阅 过 程 中 不 断 地 自我 提问 及 思考 解答 、 指 导 撰 写 
A tue 最 后 ， 我 们 学 习 了 一 些 有 助 于 测 
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附录 A ”C++11 部 分 语言 特性 简明 参考 


C++ 新 标准 增加 的 并 不 只 是 对 并 发 的 支持 ， 除 此 之 外 还 有 一 整套 的 语言 特性 
以 及 新 的 类 库 。 在 这 一 附录 中 ， 我 会 对 一 些 C++11 新 语言 特性 进行 一 番 概 述 ， 这 
些 特性 有 助 于 我 们 理解 Thread 库 以 及 本 书 的 其 他 内 容 。 它 们 之 中 除了 
thread local (参见 A.8 节 ) 外 ， 与 并 发 都 没有 直接 的 联系 ， 但 在 进行 多 线程 编 
程 的 时 候 却 很 实用 。 这 里 涉及 的 内 容 ， 都 是 对 简化 代码 或 提高 代码 可 读 性 所 必需 
(如 右 值 引用 ) 或 者 很 重要 的 。 使 用 了 这 些 特性 的 代码 或 许 刚 开始 会 因为 不 为 大 
家 所 熟知 ， 而 显得 很 难 懂 ， 但 当 你 熟悉 它们 之 后 ， 结 果 就 会 反 过 来 。 随 着 C++11 
逐渐 流行 开 来 ， 利 用 这 些 特性 的 代码 就 会 变 得 稀 松 平 弟 。 


话 不 多 说 ， 让 我 们 首先 来 看 看 右 值 引用 Crvaluereferences) ， 在 线程 库 中 ， 
为 Lo TEENS 锁 或 者 其 他 任何 东西 的 所 有 权 转 换 ， 右 值 引用 被 
广泛 


AA 右 值 引 用 


如 果 你 曾 做 过 C++ 编程 ， 就 会 对 引用 很 熟悉 。C++ 的 引用 人 允许 我 们 为 一 个 现 
a 
o 例如， 


int var=42; 创建 一 个 到 变量 的 


int& ref=var; qe 引用 因为 对 引用 进行 赋值 ， 
ref=99; 本 体 也 被 修改 了 
assert (var==99) ; < 


迄今 为 止 我 们 所 使 用 的 引用 都 是 左 值 引 用 〈lvaluereferences) 。 左 值 
(Ivalue) 这 一 术语 来 源 于 C 语 言 ， 用 来 指 代 那 些 可 以 用 在 赋值 表达 式 左 侧 的 东 
西 ， 具 名 对 象 、 在 栈 和 堆 上 分 配 的 对 象 ， 或 者 其 他 对 象 的 成 员 ， 总 之 就 是 有 确定 
存储 空间 的 东西 。 而 术语 右 值 (value) 也 是 源 自 C 语 言 ， 指 的 是 只 能 在 赋值 表 
达 式 右 侧 出 现 的 东西 ， 如 字面 值 和 临时 对 象 。 左 值 引 用 只 能 被 绑 定 到 左 值 ， 不 能 
绑 定 到 右 值 。 例 如 ， 你 不 能 这 样 写 : 


int& i=42; a— 不 能 编译 


因为 42 是 一 个 右 值 。 好 吧 ， 这 不 是 太 准 确 ; 你 一 直 能 够 将 一 个 右 值 绑 冠 
到 const 左 值 引用 上 : 


int const& i=42; 


但 是 ， 在 右 值 引用 之 前 ， 为 了 能 够 将 临时 对 象 作为 引用 参数 传递 给 函数 ， 
C++ 标准 故意 设置 了 一 个 例外 。 人 允许 进行 隐 式 转换 ， 所 以 你 可 以 这 样 写 : 


void print (std::string const& s); 可 创建 临时 的 std::string 
print ("hello") ; < 对 象 


无 论 如 何 ，C++11 标 准 引 入 了 只 能 绑 定 到 右 值 ， 而 不 能 绑 定 到 左 值 的 右 值 引 
用 Crvaluereferences) ， 在 声明 的 时 候 从 使 用 一 个 && 符 号 改 为 使 用 两 个 & 符 号 : 


int j-42; “j 不 能 编译 
< 


int&& k=j; 
于 是 ， 你 可 以 通过 函数 重 载 ， 让 一 个 重 载 版 本 接受 左 值 引用 ， 另 一 个 接受 右 
值 引用 ， 来 决定 函数 的 形 参 是 左 值 还 是 右 值 ， 这 就 是 移动 语义 


(movesemantics) 的 基础 。 


A.1.1 移动 语义 


石 值 通 常 是 临时 对 象 ， 因 此 可 以 被 自由 地 修改 。 如 果 已 知 函 数 的 形 参 是 一 个 
右 值 ， 那 么 就 可 以 将 它 用 作 临 时 存储 ， 或 者 “ 禄 取 ” 其 内 容 而 不 影响 程序 的 正确 
性 。 这 就 意味 着 ， 你 可 以 移动 (move) 右 值 参数 的 内 容 ， 而 不 是 复制 (copy) 其 
内 容 。 对 于 大 型 的 动态 结构 ， 这 样 做 可 以 节约 大 量 的 内 存 开 文 ， 并 且 能 够 提供 很 
大 的 优化 空间 。 考 虑 一 个 函数 ， 它 接受 一 个 std: :vector<int> 类 型 的 形 参 ， 并 
且 在 内 部 复制 一 份 以 便于 在 不 影响 原 数 据 的 情况 下 进行 修改 。 以 往 的 做 法 是 ， 将 
这 个 参数 作为 一 个 常量 左 值 引 用 ， 并 且 在 内 部 进行 复制 。 


void process copy(std::vector«int» const& vec ) 


{ 


std: :vector<int> vec(vec ); 
vec.push_back (42) ; 


这 就 允许 函数 同时 接受 左 值 和 右 值 ， 但 每 次 都 被 迫 进 行 一 次 复制 。 如 果 你 用 
一 个 接受 右 值 引用 的 版 本 重 载 该 函数 ， 你 就 可 以 避免 在 右 值 的 情况 下 做 复制 ， 因 
为 你 明白 可 以 自由 地 修改 原始 值 ， 


void process copy (std: ;vector<int> && vec) 


{ 
} 


vec.push back (42) ; 


ME, WM RARBCER MERA, PMO GMA, FFA CERT 
例 中 使 用 它们 。 考 虑 清单 A.1 列 出 的 类 ， 在 默认 构造 函数 中 分 配 了 一 大 块 内 存 ， 
它 会 在 析 构 函数 中 被 释放 。 


清单 A.1 具有 移动 构造 函数 的 类 


class X 


{ 
private: 
int* data; 
public: 
BAYS 
data(new int [1000000] ) 
Ü 
~X () 
{ 
delete [] data; 
} 
X(const X& other): <0 
data (new int[1000000]) 
{ 
std: :copy (other.data, other.data+1000000, data) ; 
} 
X(X&& other): +O 
data (other.data) 
{ 
other .data=nullptr; 
j 
)3 


找 贝 构造 函数 Ccopyconstructor) @@ 正 是 按照 你 所 期 望 的 那样 定义 的 ， 分 配 
一 个 新 的 内 存 块 ， 然 后 将 数据 复制 进去 。 然 而 ， 你 还 可 以 编写 一 个 通过 右 值 引用 
接受 原 值 的 构造 函数 人 @， 这 就 是 移动 构造 汕 数 (moveconstructor) 。 在 这 个 例子 
里 ， 仅 仅 是 把 数据 的 指针 复制 一 份 ， 然 后 赋 以 other 实例 一 个 空 指针 ， 这 样 就 可 
以 节约 大 量 的 内 存 空 间 和 从 右 值 创 建 变 量 的 时 间 。 


对 于 类 X 而 言 ， 移 动 构造 函数 仅仅 是 一 项 优化 ， 但 在 有 些 场 合 ， 即 便当 提供 
一 个 拷贝 构造 函数 是 之 无 意义 的 时 候 ， 移 动 构造 函数 也 有 其 意义 。 例 
如 ，std: :unique_ptr<> 的 全 部 音义 就 在 于 每 个 非 空 实 例 都 是 指向 其 对 象 的 唯一 
各 针 ， 因 此 揽 贝 构造 函数 是 没有 意义 的 。 然 而 ， 移 动 构造 函数 允许 在 实例 间 传 送 
HET ATA, JEH.füYTstd: :unique_ptr<> 被 用 作 函 数 的 返回 值 旨 针 被 移 
动 而 不 是 被 复制 了 。 


如 果 你 希望 显 式 地 从 一 个 你 确信 不 会 再 使 用 的 命名 对 象 中 移动 数据 ， 你 可 以 


通过 使 用 static_cast<X&&> 或 者 调用 std: :move() 来 将 其 转换 为 右 值 : 
xX cL 

X x2zstd::move (x1); 

X x3zstatic cast«X&&»(x2); 


当 你 希望 将 参数 值 移入 局 部 变量 或 成 员 变量 的 时 候 ， 就 可 以 从 中 获 益 ， 因 为 
一 个 右 值 引 用 参数 虽然 可 以 绑 定 到 右 值 ， 但 在 函数 肉 部， 却 是 被 视 为 左 值 的 : 


void do stuff(X&& x ) 


( 


X a(x ); a! 复制 X 
X b(std::move(x )) ; al 复制 | 2 
) | ER, ESEIA 
stuff (X()); ye a f&5IR 
7i —— ik, ZEA 


do stuff (x) i « 右 值 引用 


移动 语义 在 Thread 类 库 中 被 广泛 使 用 ， 既 可 以 用 在 对 于 复制 没有 语义 上 的 意 
义 但 资源 可 以 被 转移 的 地 方 ， 也 可 以 作为 一 项 优化 ， 以 避免 反正 会 被 销毁 掉 的 源 
所 带 来 的 复制 开销 。 在 2.2 节 的 一 个 例子 中 ， 你 曾 看 到 我 们 用 std: :move( ) 将 一 
个 std: :unique_ptr<> 实 例 传送 到 一 个 新 建 的 线程 中 ， 然 后 在 2.3 节 中 ， 我 们 又 
看 到 了 在 std: :thread 实 例 间 传送 线程 的 所 有 权 。 


std::thread、 std::unique_lock<>, std::future<>, std: :promise<> 
和 std: :packaged_task<> 都 是 不 可 复制 的 ， 但 它们 都 具有 移动 构造 函数 ， 人 允许 
相关 资源 在 实例 间 进 行 传输 ， 并 且 支 持 它们 作为 函数 的 返回 值 。std: :string 和 
std: :vector<> 可 以 被 复制 ， 但 它们 同样 具有 移动 构造 函数 和 移动 赋值 操作 符 ， 
以 此 来 避免 大 量 数据 作为 右 值 时 的 复制 开销 。 


C++ 标准 库 并 不 会 对 显 式 移入 另 一 个 对 象 的 对 象 做 任何 处 理 ， 除 了 销毁 和 对 
其 赋值 (复制 或 者 移动 ， 后 者 更 常见 ) 之 外 。 然 而 ， 确 保 一 个 处 于 移入 状态 的 类 
的 不 变性 ， 是 好 的 习惯 。 例 如 ， 一 个 用 作 移 动 来 源 的 std: :thread 实 例 等 效 于 一 
个 默认 构造 的 std: :thread 实例， 一 个 用 作 移 动 来 源 的 std: :string 实 例 仍然 有 具 
( 即 不 知道 该 字符 串 有 多 长 或 者 

含 什么 字符 ) 。 


A.1.2 右 值 引用 与 函数 模板 


使 用 右 值 引用 作为 函数 模板 的 参数 的 最 终 差 别 在 于 如 果 函 数 形 参 是 对 模板 参 
数 的 右 值 引用 ， 如 果 提 供 了 一 个 左 值 ， 自 动 模板 参数 类 型 推 师 会 将 类 型 推断 为 左 
值 引 用 ， 如 果 提 供 的 是 右 值 ， 则 推断 为 普通 的 无 修饰 类 型 。 这 听 起 来 有 些 绕 口 ， 
所 以 我 们 来 看 一 个 示例 。 考 虑 下 面 的 这 个 函数 : 


template<typename T> 
void foo(T&& t) 


WRF AG OB Ata A ET A, RAT SHE TABLE A: 
foo (42) ; «— 调用 foo-int-(42) | 调用 foo<double>(3.14159) 
f00(3.14159) ; E: 
foo(std::string()); «— 调用 foo<std::string>(std::string()) 

然而 ， 如 果 你 用 一 个 左 值 来 调用 foo，T 就 会 被 推断 为 一 个 左 值 引 用 : 
E on 4] 调用 foocint& (9) 


因为 函数 参数 声明 为 T&&， 也 就 是 一 个 引用 的 引用 ， 它 被 视 为 原始 的 引用 类 
型 。 于 是 foo<int&>() 的 签名 就 是 : 


void foo<int&>(int& t); 


这 就 允许 单个 函数 模板 同时 接受 左 值 和 右 值 参 数 ， 并 且 被 用 作 std: : thread 
的 构造 函数 (参见 2.1 节 和 2.2 节 〉 ， 以 便于 当 参 数 是 右 值 的 时 候 ， 受 支持 的 可 调 
用 对 象 能 够 被 移动 到 内 部 存储 中 ， 而 非 复制 。 


A.2 deleted 2% 2X 


有 时 候 ， 人 允许 一 个 函数 被 复制 是 没有 意义 的 。std:mutex 就 是 个 典型 的 例子 
一 一 如 果 你 真 的 对 互 斥 元 进行 复制 这 意味 着 什么 ?std: :unique_lock<> 是 另 一 
个 例子 ， 某 个 实例 是 其 所 持 有 锁 的 唯一 拥有 者 。 如 果真 的 对 其 进行 复制 ， 就 意味 
着 那个 副本 也 控制 该 锁 ， 这 是 没有 意义 的 。 在 实例 间 转 移 所 有 权 ， 正 如 A.1.2 节 中 
提 到 的 ， 是 有 意义 的 ， 但 那 并 不 是 复制 。 我 可 以 肯定 你 还 遇 到 过 其 他 的 例子 。 

过 去 阻止 一 个 类 被 复制 的 惯常 方法 是 将 拷贝 构造 函数 和 拷贝 赋值 操作 符 声 明 
为 私有 的 ， 并 且 不 提供 其 实现 。 如 果 有 任何 类 外 部 的 代码 试图 复制 一 个 实例 ， 将 
会 导致 一 个 编译 时 错误 ， 如 果 任 何 类 成 员 函 数 或 者 友 元 试图 复制 一 个 实例 ， 则 会 
导致 一 个 连接 时 错误 缺少 实现 所 导致 〉: 


class no_copies 


public: 
no_copies{}{} 

private: 
no_copies(no_copies const&) ; o 没有 实现 
no copies& operator={no copies constk&); 


no copies a; O 不 会 编译 
no copies b(a); <q 


在 C++11 中 ， 委 员 会 认识 到 这 虽然 是 惯常 做 法 ， 但 同时 也 认识 到 这 有 一 些 不 
优雅 。 于 是 ， 委 员 会 提供 了 一 个 更 加 通用 的 机 制 ， 你 还 可 以 将 其 应 用 到 其 他 场 
合 ， 你 可 以 通过 在 函数 声明 前 添加 =deleted， 将 一 个 函数 声明 为 已 删除 的 
(deleted) 。 于 是 no_copies 可 以 写 为 : 


class no copies 


{ 
public: 

no_copies() {} 

no copies(no copies const&) = delete; 

nio copies& operator-(no copies const&) = delete; 
) 


这 就 比 原来 的 代码 更 加 有 具有 描述 性 ， 并 且 清 楚 地 表达 了 意图 。 这 也 允许 编译 
器 给 出 更 具 描 述 性 的 错误 信息 ， 并 且 将 你 在 类 的 成 员 函 数 内 执行 拷贝 的 错误 从 连 
接 时 转移 到 了 编译 时 。 


如 果 在 删除 了 拷贝 构造 函数 和 拷贝 赋值 操作 符 的 同时 ， 显 式 编写 了 移动 构造 


函数 和 移动 赋值 操作 符 ， 该 类 就 变 成 只 能 移动 的 ， 就 像 std: :thread 和 
std: :unique_lock<> 一 样 。 清 单 A.2 展 示 了 这 种 只 移动 类 型 的 实例 。 


清单 A.2 简单 的 只 移动 类 型 


class move only 
( 
std::unique ptr«my class» data; 
public: 
move only(const move only&) = delete; 
move only(move only&& other): 
data (std: :move(other.data) ) 
{} 
move_only& operator-(const move only&) = delete; 
move only& operator- (move only&& other) 


data=std: :move (other.data) ; 
return *this; 
} 
E 


move only m1; 铺 误 ， 拷 贝 构 造 函 数 声 LER EE TE 
move only m2 (m1); <a 明 为 被 删除 的 ER, 找到 移动 构造 
move only m3 (std: :move (m1) ); «— WR 


只 移动 对 象 可 以 作为 函数 参数 传 入 ， 也 可 以 从 函数 中 返回 。 但 如 果 你 希望 从 
一 个 左 值 移 入 ， 你 必须 总 是 显 式 地 使 用 std: :move() 或 者 static_cast<T&&>。 


你 可 以 将 =delete 标 识 符 应 用 到 任意 函数 ， 而 不 仅仅 是 找 贝 构造 函数 和 拷贝 
赋值 操作 符 。 这 可 以 清楚 地 表示 该 函数 是 不 可 用 的 ， 但 并 不 仅 限 于 此 。 一 个 被 删 
除 的 函数 按照 通常 的 方式 参与 重 载 方 采 ， 并 且 当 它 被 选中 时 仪 导致 一 个 编译 时 错 
误 ， 这 可 以 用 来 移 除 特定 的 重 载 。 例 如 ， 如 果 你 的 函数 接受 一 个 short 类 型 参 
数 ， 你 可 以 通过 编写 一 个 接受 int 类 型 变量 的 重 载 版 本 并 将 其 声明 为 被 删除 的 ， 
OR BELLE XT int A E : 


void footshort); 
void roo(1nt) = delete; 


但 凡 答 试用 int 来 调用 foo， 现 在 都 会 遇 到 编译 错误 ， 调 用 者 必须 显 式 地 将 值 
转换 为 short: 


foo(42); + pep: - 33a EY a 
: 错误 , int 重 载 声明 为 被 
foo( (short) 42) ; Ex Ad 
EN HEH 


A.3 defaulted rx Zi 


删除 的 函数 允许 你 显 式 声明 一 个 函数 未 被 实现 ， 而 默认 的 〈defaulted) 函数 
则 恰恰 相反 ， 它 们 人 允许 你 告诉 编译 器 必须 为 你 编写 这 个 函数 ， 作 为 其 "默认 ” 实 
现 。 当 然 ， 你 只 能 对 编译 器 可 以 自动 生成 的 函数 这 样 做 ， 包 括 默 认 构 造 函 数 、 本 
构 函 数 、 找 贝 构造 函数 、 移 动 构造 阔 数 、 找 贝 赋值 操作 符 和 移动 赋值 操作 符 。 


那 你 为 什么 会 要 这 么 做 昵 ? 以 下 是 一 些 可 能 的 原因 。 


为 了 改变 函数 的 可 访问 性 。 在 默认 情况 下 ， 编 译 器 生成 的 函数 是 public 的 。 
如 果 你 希望 将 它们 变 为 protected 或 者 private， 你 就 得 亲自 去 编写 它们 。 

通过 将 它们 声明 为 defaulted， 你 就 可 以 让 编译 器 去 编写 这 些 函 数 ， 同 时 又 改 
变 它们 的 访问 级 别 。 

作为 注解 。 即 使 编译 器 生成 的 版 本 足够 使 用 ， 仍 然 值 得 像 这 样 将 其 显 式 进行 
声明 ， 以 便于 你 或 者 其 他 人 将 来 再 看 代码 的 时 候 能 够 清楚 地 了 解 这 是 有 意 为 


Lo 

为 了 强制 编译 器 去 生成 该 函数 ， 否 则 它们 可 能 不 会 这 么 做 。 典 型 的 是 针对 默 
认 构 造 函 数 ， 只 有 在 没有 用 户 自 定义 构造 函数 的 时 候 它 才 通 常会 由 编译 器 生 
成 。 如 果 你 需要 上 自 定义 一 个 拷贝 构造 函数 〈 举 个 例子 ) ， 你 仍然 可 以 通过 声 
明 一 个 defaulted 的 默认 构造 函数 ， 而 让 编译 器 生成 它 。 

为 了 将 一 个 析 构 函数 设 为 虚拟 的 ， 将 其 留 给 编译 器 来 生成 。 

e 强制 声明 一 个 特定 的 拷贝 构造 函数 ， 如 令 其 接受 一 个 非 const 引 用 的 源 参数 
而 不 是 一 个 const 引 用 。 

利用 编译 器 生成 函数 的 一 些 特定 属性 ， 如 果 你 自己 提供 实现 的 话 ， 可 能 会 失 
去 它们 一 一 这 一 点 我 们 稍 后 会 提 及 。 


类 似 于 deleted 函 数 通 过 后 缀 =delete 来 进行 声明 ，defaulted 函 数 只 需要 在 声明 
后 添加 =default 来 进行 声明 ， 如 : 


class 了 
private: esc 
YO = default; < 改变 访问 级 别 ee ee 
UNE 接受 一 个 非常 量 声明 为 defaulted 作 
Y(Y&) = default; a 引用 为 注解 
T& operator=(const Y&) = default; TT a 
protestei. | 改变 访问 级 别 并 且 
virtual ~Y() = default; 4 添加 virtual 


}; 


我 之 前 提 到 过 编译 器 生成 的 函数 可 以 具有 一 些 特殊 的 属性 ， 而 在 用 户 定 义 的 
版 本 中 却 无 法 获得 。 其 中 最 大 的 区 别 就 是 编译 器 生成 的 函数 可 以 是 平凡 的 


(trivial) 。 这 会 剖 来 包括 下 面 所 述 的 一 些 后 果 。 


e 具备 平凡 的 拷贝 构造 函数 、 平 凡 的 拷贝 赋值 操作 符 和 平凡 的 析 构 图 数 的 对 象 
可 以 被 memcpy 和 memmove 复 制 。 
constexpr 国 数 《〈 参 见 A.4 节 ) 所 使 用 的 字面 值 类 型 必须 具有 一 个 平凡 的 构造 函 
数 、 拷 贝 构造 函数 和 析 构 函数 。 
拥有 平凡 的 默认 构造 函数 、 找 贝 构造 函数 、 拷 贝 赋值 操作 符 和 析 构 函数 的 类 
可 以 用 在 一 个 具有 用 户 定 义 构造 函数 和 析 构 函数 的 联合 体 中 。 
e 具有 平凡 的 拷贝 赋值 操作 符 的 类 可 以 在 std: :atomic<> 类 模板 (参见 5.2.6 
节 ) 中 使 用 ， 用 来 提供 该 类 型 值 的 原子 操作 。 
仅 将 函数 声明 为 =default 并 不 能 使 其 成 为 平凡 的 (只 有 在 类 同时 支持 所 有 其 
他 条 件 的 时 候 ， 相 应 的 函数 才能 成 为 平凡 的 ) ， 但 如 果 在 用 户 代码 中 显 式 地 编写 
该 函数 ， 则 会 阻止 其 成 为 平凡 的 。 
具有 编译 器 生成 函数 和 用 户 提供 的 等 效 函 数 的 类 之 间 的 第 二 个 不 同 ， 就 是 没 
有 用 户 提 供 的 构造 函数 的 类 可 以 作为 聚合 体 (aggregate〉， 并 且 可 以 通过 一 个 聚 
合 初 始 化 器 进行 初始 化 : 


struct aggregate 


{ 
aggregate () = default; 
aggregate (aggregate const&) = default; 
int a; 
double b; 
4 


aggregate x={42,3.141}; 

在 这 里 ，x.a 被 初始 化 为 42，x.b 被 初始 化 为 3.141。 

编译 器 生成 的 函数 和 用 户 提 供 的 等 效 函 数 之 间 的 第 三 点 区 别 非 常 深奥 ， 仅 仅 
适用 于 默认 构造 函数 ， 而 且 仅仅 是 那些 满足 特定 条 件 的 类 的 默认 构造 函数 。 考 虑 
下 面 这 个 类 : 
struct X 


| 


bi 


如 果 你 不 使 用 初始 化 器 创建 类 X 的 实例 ， 那 么 其 中 的 int(a) 会 被 默认 构造 
(defaultinitialized) 。 如 果 该 对 象 拥有 静态 存储 期 ， 那 么 它 会 被 初始 化 为 零 ; 8 


int a; 


则 ， 它 会 拥有 一 个 不 确定 的 值 ， 如 果 在 其 未 被 赋予 新 值 之 前 访问 它 ， 可 能 会 导致 
未 定义 的 行为 : 


X xl; a xla 具 有 不 确定 的 值 


男 一 方面 ， 如 果 你 通过 显 式 地 调用 默认 构造 函数 来 初始 化 X 的 实例 ， 那 么 a 会 
被 初始 化 为 零 : 


X x2=X() ; 4 xla== 


这 种 怪异 的 特性 同样 延伸 至 基 类 和 成 员 。 如 果 你 的 类 拥有 编译 器 生成 的 默认 
构造 函数 ， 并 且 所 有 数据 成 员 和 基 类 同样 拥有 编译 器 生成 的 默认 构造 函数 ， 则 那 
些 基 类 和 内 置 类 型 成 员 的 数据 成 员 也 会 如 此 ， 或 是 留 下 一 个 不 确定 的 值 ， 或 是 初 
始 化 为 零 ， 这 取 雇 于 外 部 的 类 的 默认 构造 函数 是 否 被 显 式 调用 。 


尽管 这 条 规则 很 混乱 并 且 容易 导致 错误 ， 但 它 却 有 其 作用 ， 并 且 如 果 你 自己 
编写 默认 构造 函数 ， 你 会 失去 这 条 特性 。 像 a 这 样 的 数据 成 员 总 是 被 初始 化 〈 因 
个 值 或 者 显 式 默 认 构 造 函 数 ) 或 者 总 是 未 被 初始 化 (因为 你 没有 这 
么 做 ) : 


如 果 你 像 第 三 个 例子 @ 中 那样 ， 从 X 的 构造 函数 中 省 略 a 的 初始 化 ， 那 么 对 于 
X 的 非 静态 实例 ，a 未 被 初始 化 ， 对 于 具有 静态 存储 期 的 X，a 被 初始 化 为 零 。 


在 通常 情况 下 ， 如 果 你 手动 编写 任何 其 他 的 构造 函数 ， 编 译 器 就 不 再 为 你 生 
成 默认 构造 函数 ， 所 以 如 果 你 需要 的 话 ， 就 得 自己 去 编写 它 ， 这 意味 着 你 将 失去 
这 一 奇异 的 初始 化 特性 。 然 而 ， 通 过 显 式 地 将 该 构造 函数 声明 为 defaulted， 可 以 
令 编译 器 强制 地 为 你 生成 默认 构造 函数 ， 这 一 特性 也 会 保留 下 来 ; 


X::X() = default; + 为 a 应 用 默认 初始 化 规则 


这 一 特性 被 用 于 原子 类 型 (参见 5.2 节 ) ， 它 们 的 构造 函数 就 显 式 地 为 
defaulted。 它 们 的 初始 值 总 是 未 定义 的 ， 除 非 (a) 它 们 具有 静态 存储 时 间 段 “因此 
被 静态 地 初始 化 为 零 ) ; (b) 显 式 地 调用 默认 构造 函数 ， 请 求 零 初始 化 ; (@O 显 式 地 
指定 一 个 值 。 注 意 在 原子 类 型 的 情况 下 ， 用 一 个 值 进 行 初始 化 的 构造 函数 被 声明 
为 constexpr (参见 A.4 节 ) ， 以 便 允 许 静 态 初始 化 。 


A.4 constexpr rs 2 


像 42 这 样 的 整 型 字面 值 是 常量 表达 式 (constantexpressions) 。 人 简单 的 算术 
表达 式 ， 如 23x2-4， 也 是 如 此 。 你 甚至 可 以 使 用 整数 类 型 的 const 变 量 ， 它 们 又 
是 通过 由 常量 表达 式 组 成 的 新 的 常量 表达 式 来 进行 初始 化 的 : 
const int 123; 
const int two i-i*2; 
const int four=4; 
const int forty two-two i-four; 


除了 使 用 常量 表达 式 来 创建 能 用 于 其 他 常量 表达 式 的 变量 ， 还 有 些 事 情 你 只 
能 通过 常量 表达 式 来 完成 。 


。 指定 数组 的 边界 : 


" dE ET 县 一 个 堂 
int bounds=99; 错误 , bounds 不 是 一 个 党 


PERS EL 
int array [bounds]; + 量 表达 式 | 正确 ， bounds? A 
const int bounds2-99; 一 个 常量 表达 式 
int array2 [bounds2]; E 


。 指定 非 类 型 模板 参数 的 值 : 


template<unsigned size> 


struct test 错误 bounds 
{}; 不 是 一 个 常量 
test<bounds> ia; a 表达 式 | 正确 ，bounds2 是 一 
test<bounds2> ia2; at 个 常量 表达 式 
。 在 类 定义 中 ， 为 一 个 static const 的 整数 类 型 类 数据 成 员 提 供 一 个 初始 化 
ae: 
class X 


{ 


); 
e. 为 内 置 类 型 或 者 集合 提供 一 个 初始 化 器 ， 它 可 被 用 于 静态 初始 化 : 


static const int the answer=forty two; 


struct my_aggregate 


{ 


int a; 
int b; : 
bs .] 静态 初始 化 
static my_aggregate mal={forty_two,123}; < » 
int dummy-257; 动态 初始 化 
static my aggregate ma2={dummy, dummy}; a 


© 像 这 样 的 静态 初始 化 可 以 用 来 避免 初始 化 顺序 的 问题 以 及 竞争 条 件 。 


上 述 的 这 些 都 不 是 新 生 事 物 ， 在 1998 版 本 的 C++ 标准 中 你 都 可 以 做 到 。 然 
而 ， 在 新 标准 中 ， 通 过 引入 constexpr 关 键 字 ， 常 量 表达 式 
(constantexpression) 的 构成 被 扩展 了 。 


constexpr 关 键 字 主要 作为 函数 修饰 符 。 如 果 函 数 的 参数 和 返回 值 满足 特定 
的 要 求 ， 并 且 函 数 体 足 够 简洁 ， 该 函数 就 可 以 声明 为 constexpr， 这 样 它 就 可 以 
在 常量 表达 式 中 被 使 用 ， 比 如 : 


constexpr int square(int x) 


{ 
j 


int array[square(5)]; 
在 这 里 ，array 会 拥有 25 条 记录 ， 因 为 square 被 声明 为 constexpr。 当 然 ， 
仅仅 因为 该 函数 可 以 被 用 于 常量 表达 式 并 不 意味 着 它 的 所 有 用 法 都 自动 地 成 为 常 


量 表达 式 。 


return x*x; 


n Hn Er at E a 
int dummy=4; 错误 , dummy 不 是 一 人 
int array [square (dummy) ] ; ER 常量 表达 式 


在 这 个 例子 中 ，dummy 不 是 一 个 常量 表达 式 @， 所 以 square(dummy) 也 不 是 
( 仅 是 一 个 常规 的 函数 调用 ) ， 因 此 也 不 可 被 用 来 指定 array 的 边界 。 


A.4.1 constexpr 与 用 户 定 义 类 型 


到 目前 为 止 ， 所 有 的 示例 都 是 用 的 内 置 类 型 比如 int。 然 而 ， 新 C++ 标准 允许 
常量 表达 式 可 以 是 任何 满足 字面 值 类 型 要 求 的 类 型 。 如 果 要 一 个 类 型 具有 字面 值 
类 型 资质 ， 以 下 几 点 必须 全 部 满足 。 


。 必须 具备 平凡 的 拷贝 构造 函数 。 
© 必须 具备 平凡 的 析 构 函数 。 
e. 所 有 非 静态 数据 成 员 和 基 类 必须 是 平凡 的 类 型 。 


人 一 


。 必 须 具有 一 个 平凡 的 默认 构造 函数 或 者 constexpr 构 造 函 数 ， 而 非 拷贝 构造 
函数 。 


我 们 将 马上 看 一 看 constexpr 构 造 函 数 。 现 在 ， 我 们 关注 一 下 具有 平凡 的 默 
认 构 造 函 数 的 类 ， 比 如 下 面 列 出 的 CX 类 。 


清单 A.3 ”具有 平凡 默认 构造 函数 的 类 


class CX 
{ 
private: 
int a; 
inb b: 
public: 
CX() = default; <0 
Cx(int a , int b ): EE 2) 


a(a ),b(b) 
Ü 


int get aí() const 


{ 

return a; 
} 
int get_b(} const 
{ 

return b; 
} 
int foo{) const 
{ 

return a+b; 
} 


}; 


注意 ， 我 们 显 式 地 将 默认 构造 函数 @ 声 明 为 defaulted (参见 A.3 节 ) ， 这 是 
为 了 在 面 对 用 户 定义 构造 函数 @ 的 时 候 保 持 它 的 平凡 性 质 。 因 此 该 类 型 满足 作为 
字面 值 类 型 的 全 部 条 件 ， 你 就 可 以 将 其 用 在 常量 表达 式 中 ， 比 如 ， 提 供 一 
个 constexpr 函 数 来 创建 新 的 实例 : 


constexpr CX create cx() 


| 


} 
你 还 可 以 创建 一 个 简单 的 constexpr 函 数 来 复制 其 参数 ; 


constexpr CX clone(CX val) 


| 
} 


return CX(); 


return val; 


不 过 这 差不多 就 是 所 有 你 可 以 做 的 事情 了 一 一 一 个 constexpr 函 数 仪 能 调用 
其 他 的 constexpr 函 数 。 所 以 你 能 够 做 的 ， 就 是 将 constexpr 应 用 至 CX 的 成 员 函 
BUM HH PK BL: 


class CX 


{ 


private: 
int a; 
int b; 
public: 
CX() = default; 
constexpr CX(int a , int b ) : 
aia ),b(lb ) 
{} 


constexpr int get a() const <0 


{ 
} 


constexpr int get_b() «e 


{ 
} 


constexpr int foo() 


{ 


return a; 


return b; 


return a+b; 


\; 


注意 ，get_a()@ 后 的 const 限 定 符 现 在 是 多 余 的 ， 因 为 使 用 constexpr 已 
经 暗示 这 一 点 了。 即便 省 略 了 const 限 定 符 ，get_b() 仍 然 是 const 的 。 现 在 可 以 
定义 如 下 所 示 的 更 加 复杂 的 constexpr 函 数 。 


constexpr CX make_cx(int a) 


( 
) 


constexpr CX half double(CX old) 
( 


) 
constexpr int foo squared(CX val) 


( 
) 


AE 
int array[foo squared(half double(make cx(10)))]; gl 49 TICK 


return CX(a,1); 


return CX(old.get a()/2,01d.get b()*2); 


return square (val.foo()); 


然而 有 趣 的 是 ， 如 果 你 所 需要 的 仅仅 是 一 个 更 加 优雅 的 计算 数组 界限 的 方式 
或 者 一 个 完整 的 常数 ， 这 样 做 会 花费 大 量 的 精力 。 引 入 用 户 定 义 类 型 的 常量 表达 
式 和 constexpr 函 数 的 主要 优点 ， 就 是 由 种 量 表达 式 初 始 化 的 字面 值 类 型 对 象 会 
被 静态 初始 化 ， 于 是 它们 的 初始 化 就 避免 了 了 竞争 条 件 和 初始 化 顺序 问题 。 


CX si-half double {CX(42,19)); < 一 静态 初始 化 


这 同样 包括 了 构造 函数 。 如 果 构 造 函 数 被 声明 为 constexpr， 且 构造 郴 数 的 
参数 是 常量 表达 式 ， 那 么 该 初始 化 就 是 一 个 常量 初始 化 〈constantinitialization ) 
并 且 作 为 静态 初始 化 阶段 的 一 部 分 来 进行 。 这 是 C++11 中 为 并 发 而 设 的 最 重要 的 
变化 之 一 ， 通 过 允许 用 户 自 定义 构造 函数 仍 可 进行 静态 初始 化 ， 你 可 以 在 其 初始 
化 时 避免 所 有 的 竞争 条 件 ， 因 为 保证 了 它们 在 所 有 代码 运行 前 就 被 初始 化 。 


以 上 对 于 像 std: :mutex (参见 3.2.1 节 ) 或 std: :atomic<> (参见 5.2.6 节 ) 
之 类 的 特别 重要 你 可 能 想 要 使 用 一 个 全 局 实例 来 同步 访问 其 他 变量 ， 并 在 访 
问 过 程 中 避免 竞争 条 件 ， 而 如 果 互 斥 元 受 限 于 竞争 条 件 ， 前 面 所 述 的 就 将 无 法 实 
现 ， 所 以 std: :mutex 的 默认 构造 函数 声明 为 constexpr， 以 确保 互 斥 元 的 初始 化 
总 是 作为 静态 实例 化 阶段 的 一 部 分 来 完成 的 。 


A.4.2 constexprX] 2 


到 目前 为 止 我 们 看 到 constexpr 应 用 在 函数 上 ， 它 同样 可 以 被 应 用 于 对 象 。 
这 主要 用 于 检测 目的 ， 它 可 以 确认 该 对 象 是 通过 常量 表达 式 、constexpr 构 造 函 
数 或 由 常量 表达 式 构 成 的 初始 化 器 来 初始 化 的 。 它 也 会 将 对 象 声 明 为 const: 


constexpr int i=45; < 一 正确 .] 错误 ，std::string 不 
是 字面 值 类 型 


constexpr std::string s("hello"); 


int foo(); ix FRE 
J 错误 ，foo0 并 未 声明 为 constexpr 


constexpr int j=foo(); 


A.4.3 constexpr r£ Zi Zi o 


为 了 将 一 个 函数 声明 为 constexpr， 它 必须 满足 一 些 要 求 。 如 果 不 满足 这 些 
要 求 ， 将 其 声明 为 constexpr 会 引起 编译 时 错误 。constexpr 函 数 所 需 的 要 求 如 
下 所 列 。 


。 所 有 的 参数 必须 是 字面 值 类 型 。 

e. 返回 值 类 型 必须 是 字面 值 类 型 。 

e. 函数 体 只 能 由 单个 return 语 句 组 成 。 

。return 语 句 中 的 表达 式 必 须 是 常量 表达 式 。 

se。 所 有 的 构造 函数 和 用 于 构造 表达 式 返 回 值 的 转换 运算 符 必 须 是 constexpr。 


这 些 看 起 来 很 直接 : 你 必须 能 够 将 函数 内 购 到 常量 表达 式 中 ， 仍 然 形成 一 个 
常量 表达 式 ， 你 也 不 能 够 修改 任何 东西 。constexpr 函 数 是 无 副作用 的 纯 函 数 。 


对 于 constexpr 类 成 员 函 数 ， 还 有 些 附加 的 要 求 。 


constexpr 成 员 函 数 不 能 是 虚拟 的 。 
函数 作为 成 员 的 这 个 类 必须 是 字面 值 类 型 。 


对 于 constexpr 构 造 函 数 ， 规 则 又 有 点 不 同 。 


构造 函数 体 必须 是 空 的 。 

每 个 基 类 必须 被 初始 化 。 

每 个 非 静 态 的 数据 成 员 必须 被 初始 化 。 

成 员 初 始 化 列表 中 使 用 的 所 有 表达 式 必须 具有 常量 表达 式 资质 。 

被 选中 用 以 初始 化 数据 成 员 和 基 类 的 构造 函数 必须 是 constexpr 构 造 冰 数 。 
构造 数据 成 员 和 基 类 的 表达 式 里 所 使 用 到 的 所 有 构造 冰 数 和 转换 运算 符 都 必 


须 是 constexpr 的 。 
这 是 与 针对 函数 而 言 相 同 的 一 组 规则 ， 区 别 在 于 没有 返回 值 ， 所 以 没 


有 return 语 句 。 与 之 不 同 的 是 ， 构 造 函数 在 成 员 初 始 化 列表 中 初始 化 所 有 的 基 类 
和 数据 成 员 。 平 几 的 拷贝 构造 函数 是 隐 式 的 constexpr。 


A.4.4 ”constexpr 与 模板 


如 果 模 板 的 某 个 特定 实例 化 的 参数 和 返回 值 不 是 字面 值 类 型 ， 当 constexpr 
被 应 用 到 函数 模板 或 者 类 模板 的 成 员 函 数 上 的 时 候 ， 此 关键 字 会 被 忽略 。 这 就 允 
许 你 编写 这 样 的 函数 模板 ， 当 模板 参数 类 型 合适 的 时 候 它 是 constexpr， 人 否则 就 
是 普通 的 inline 函 数 ， 例 如 : 


template<typename T> 
constexpr T sum(T a,T b) 


{ 


return a+b; 


} 正确 , sum<int> 
constexpr int i-sum(3,42); «4— 是 constexpr 
std::string s= TE, (B sum<std::string> 
sum(std::string("hello"), | 不 是 constexpr 
std::string(" world")); 


该 函数 必须 满足 作为 constexpr 函 数 的 其 他 所 有 要 求 。 你 不 能 声明 一 个 具有 
多 条 语句 的 函数 为 constexpr 仪 仪 因为 它 是 一 个 函数 模板 ， 这 仍然 是 编译 错误 。 


A.5 lambdapk Zi 


lambda 函 数 是 C++11 标 准 中 最 让 人 激动 的 特性 之 一 ， 因 为 它们 可 以 极 大 地 简 
化 代码 ， 以 及 大 量 消 除 与 编写 可 调用 对 象 相 关 的 样板 。C++11 lambda A BUBIE f 
许 一 个 函数 在 另 一 个 表达 式 中 需要 它 的 地 方 进行 定义 。 这 对 于 有 些 东西 非常 有 
用 ， 如 提供 给 等 待 函数 std: :condition_ variable 的 断言 〈 人 参见 4.1.1 节 ) ， 
为 它 允 许 语义 以 可 访问 的 变量 的 形式 快速 被 表达 ， 而 不 是 通过 一 个 函数 调用 操作 
来 获取 类 中 成 员 变量 的 所 需 状 态 。 


一 个 最 简单 的 lambda 表 达 式 定义 了 一 个 不 接受 参数 的 、 只 依赖 于 全 局 变量 和 
函数 的 自 包 含 函 数 ， 甚 至 不 必 人 返回 值 。 这 样 的 lambda 表 达 式 就 是 包括 在 一 对 花 括 
号 中 的 一 系列 语句 ， 之 前 绥 以 方 括号 〈lambda 引 导 符 ) 。 


[] { < 一 以 0 开始 lambda 表达 式 
do stuff(); 
do more stuff(); 结束 lambda 表达 式 ' 
)0; a 并 调用 之 


在 这 个 例子 中 ，lambda 表 达 式 被 紧 随 其 后 的 一 对 括号 调用 了 ， 但 通常 并 不 这 
样 做 。 首 先 ， 如 果 你 打算 直接 调用 它 ， 你 一 般 用 不 着 lambda， 而 是 将 语句 直接 写 
在 源 代码 处 。 更 通常 的 情况 是 ， 将 其 作为 参数 ， 传 给 接受 可 调用 对 象 作为 参数 的 
函数 模板 。 在 这 种 情况 下 ， 它 可 能 需要 接受 参数 ， 或 者 返回 一 个 值 ， 或 两 者 兼 
有 。 如 果 需 要 接受 参数 ， 你 可 以 像 普通 函数 那样 ， 在 lambda 引 导 符 后 面 加 上 参数 
列表 。 例 如 ， 下 面 一 段 代 码 将 向 量 的 所 有 元 素 写 入 std: : cout， 以 换行 为 分 隔 。 


std::vector«int» data-make data(); 
std::for each(data.begin(),data.end(),[] (int i) {std::cout<<i<<"\n";}); 


ik BE LS Et. Go lambdark BU HH Areturnia WZ, BA 
lambda 的 返回 类 型 就 是 待 返回 表达 式 的 类 型 。 例 如 ， 你 可 能 会 用 类 似 下 面 所 示 的 
简单 lambda， 来 等 待 std: :condition variable (24.1.17) 要 设置 的 标志 
位 。 


清单 A.4 具有 推断 返回 类 型 的 简单 lambda 


std: :condition variable cond; 
bool data_ready; 
std: :mutex m; 


void wait for data() 


{ 


std::unique lock<std::mutex> 1k(m} ; 
cond. wait (1k, [] {return data ready; }); 0 


传 给 cond.wait() 的 lambda 返 回 类 型 是 通过 data_ready 的 类 型 推断 的 ， 
即 poo1。 一 旦 条 件 变量 从 等 待 中 被 唤醒 ， 接 下 来 就 会 调用 该 互 斥 元 锁定 的 
lambda， 并 且 只 会 在 data_ready 为 true 的 时 候 ， 从 对 wait() 的 调用 中 返回 。 


那 要 是 你 无 法 将 lambda 语 句 体 写 成 单条 的 return 语 句 呢 ? 这 种 情况 下 你 就 得 
显 式 指定 返回 类 型 。 在 语句 体 只 有 一 条 return 语 句 的 时 候 ， 你 依然 可 以 这 样 做 ， 
但 如 果 lambda 语 句 体 更 为 复杂 的 时 候 ， 你 必须 这 样 做 。 返 回 类 型 是 通过 在 lambda 
参数 列表 后 跟 以 一 个 箭头 〈->) 加 返回 类 型 的 方式 进行 指定 的 。 如 果 你 的 lambda 
不 接受 任何 参数 ， 你 仍然 需要 包含 空 的 参数 列表 ， 以 便 显 式 指定 返回 值 。 你 的 条 
件 变量 预测 就 可 以 写成 ， 


cond.wait (1k, [](}->bool{return data ready;])); 


通过 指定 返回 类 型 ， 你 可 以 扩展 这 个 lambda， 来 记录 消息 或 者 做 些 更 复杂 的 
处 理 。 


cond.wait (1k, [] 0 -»bool( 
if(data ready) 


{ 


Std::cout««"Data ready” <<std::endl; 
return true; 


} 


else 


{ 


Std::cout««"Data not ready, resuming wait"««std::endl; 


return false; 


} 
His 

尽管 像 这 样 的 简单 lambda 都 很 强大 并 能 够 极 大 地 精简 代码 ， 可 它们 的 真正 实 
力 是 在 捕捉 局 部 变量 的 时 候 才 能 发 挥 出 来 。 


引用 局 部 变量 的 lambda 函 数 


使 用 [作为 lambda 引 导 符 的 lambda 函 数 不 能 引用 任何 包含 它 的 作用 域内 的 局 
部 变量 ， 它 们 只 能 使 用 全 局 变量 以 及 作为 参数 传 入 的 东西 。 如 果 你 :希望 访问 某 个 
局 部 变量 ， 你 需要 捕捉 它 。 最 简单 的 做 法 惑 是 通过 使 用 [= ] 作 为 lambda 引 导 符 ， 
来 捕捉 局 部 作用 域 中 的 整个 变量 集 。 这 就 是 所 有 你 需要 做 的 你 的 lambda 现 在 
可 以 在 其 被 创建 的 时 候 访 问 局 部 变量 的 副本 。 


为 了 实际 地 了 解 这 一 点 ， 考 虑 下 面 这 个 简单 的 函数 。 


std: :function<int (int)> make offseter(int offset) 


{ 
} 


return [=] (int j) {return offset+j;}; 


每 次 调用 make_offseter 都 会 通过 std: :function<> KAE I BRI E — A 
的 lambda 函 数 对 象 。 返 回 的 函数 会 将 所 提供 的 参数 添加 上 指定 的 偏 移 值 。 比 
H: 


int main() 

{ 
std::function«int(int)» offset 42=make offseter (42) ; 
std::function<int (int)> offset_123=make_offseter (123) ; 
std: :cout<<offset 42(12)««","««offset 123(12)««std::endl1; 
std: :cout<<offset_ 42 (12) <<", “«<offset_123 (12) <<std::endl1; 


这 段 代 码 会 输出 54,135 两 次 ， 因 为 在 第 一 次 调用 make _ offseter 时 返回 的 函 
数 ， 总 是 将 所 提供 的 参数 加 42， 而 第 二 次 调用 make_offseter 返 回 的 函数 ， 总 是 
将 所 提供 的 参数 加 123。 


这 是 捕捉 局 部 变量 的 最 安全 形式 ， 一 切 都 是 被 复制 的 ， 所 以 你 可 以 返 
lambda 并 在 原 函 数 作用 域 之 外 去 调用 它 。 但 这 并 非 唯一 的 选择 ， 相 反 的 ， 你 -— 
选择 通过 引用 来 捕捉 所 有 的 东西 。 在 这 种 情况 下 ， 一 旦 lambda 所 引用 的 变量 因为 
离开 其 所 在 的 函数 或 者 语句 块 作 用 域 而 被 销毁 ， 调 用 该 lambda 就 成 为 一 种 未 定义 
的 行为 ， 正 如 在 其 他 情况 下 引用 一 个 已 经 被 销毁 的 变量 一 样 。 


以 引用 的 方式 捕捉 所 有 局 部 变量 的 lambda 函 数 使 用 [&] 来 引导 ， 如 下 面 的 例 
所 示 ， 


int main({} 


{ 


int offset=42; 0 
std::function<int (int)> offset_a=[&] (int j){return offset+j;}; O 
offset=123; 9 
std::function<int (int)> offset_b=[&] (int j){return offset+j;}; «o 
Std::cout««offset a(12)««","««offset b(12)««std::endl; 

offset-99; 

Std::cout««offset a(12)««","««offset b(12)««std::enàl; 9 


上 个 例子 中 ， 我 们 在 make_offseter 函 数 里 使 用 了 lambda 引 导 符 [=] 来 捕捉 
偏 移 量 的 副本 ;这 个 例子 的 offset_a 函 数 使 用 lambda 引 导 符 [&]， 通 过 引用 来 捕 
捉 offset 仿 。offset 的 初始 值 是 否 为 42@@ 并 不 重要 ， 调 用 offset_a(12) 的 结果 
总 是 取决 于 offset 的 当前 值 。 尽 管 我 们 是 在 制造 第 二 个 “相同 的 ) lambda ek 
数 offset_b@ 之 前 就 将 offset 值 改 为 了 123@， 由 于 第 二 个 lambda 还 是 通过 引用 
进行 捕捉 的 ， 所 以 结果 取决 于 offset 的 当前 值 。 


现在 ， 当 我 们 打印 第 一 行 输 出 的 时 候 人 @@，offset 仍 然 是 123， 所 以 输出 
是 135,135。 然 而 ， 在 第 二 行 输 出 的 地 方 @，offset 已 经 被 改 为 99@， 所 以 这 时 
候 的 输出 是 111,111。offset_a 和 offset_b 都 是 将 offset 的 当前 值 (99) 加 到 
所 提供 的 参数 (12) LE. 


其 实 ，C++ 之 所 以 称 为 C++， 你 并 不 会 受 困 于 这 些 非 黑 即 白 的 选项 ， 你 可 以 
选择 通过 复制 捕捉 一 部 分 参数 ， 然 后 通过 引用 捕 换 一部分， 并 且 你 可 以 选择 仅仅 
捕捉 你 显 式 选 定 的 那些 变量 ， 这 些 都 可 以 通过 调整 lambda 引 导 符 实现 。 如 果 你 希 
望 复制 所 有 用 到 的 变量 ， 但 是 有 一 两 个 例外 ， 你 可 以 使 用 lambda 引 导 符 的 [=] 形 
式 ， 然 后 在 等 号 后 面 跟 上 引用 捕捉 的 变量 列表 ， 变 量 之 前 冠 以 & 符 号 。 下 面 的 例 
子 将 会 打印 1239， 因 为 1 被 复制 进 lambda， 而 J 和 k 是 引用 捕捉 的 。 


int main() 


{ 
int i-1234,j-5678,k-9; 
std::function«int()» f=[=,&j,&k] {return i+j+k;}; 
i=l; 
j=2; 
k=3; 
std::cout««fí()««std::endl; 
j 


另外 ， 你 可 以 默认 引用 捕 提 ， 但 是 通过 复制 捕捉 变量 的 一 个 指定 子 集 。 在 这 
种 情况 下 ， 使 用 lambda 引 导 符 的 [8 形式 ， 但 在 & 号 后 面 跟 以 复制 捕捉 的 变量 列 
表 。 下 面 的 例子 会 打印 5688， 因 为 i 是 引用 捕捉 的 ， 而 j 和 Kk 是 复制 的 。 


int main({) 


{ 
int i=1234,J=5678,k=9; 
std::function<int ()> f=[&,j,k] {return i+j+k;}; 
i=1; 
j=2; 
Kes: 
std: :cout<<f ()<<std::endl; 
} 


如 果 你 只 想 捕 捉 提 名 的 变量 ， 你 可 以 省 略 前 面 的 = 或 &， 仅 仅 列 出 需要 捕捉 的 
变量 ， 通 过 前 级 & 符 号 来 表明 引用 捕捉 而 非 复 制 。 下 面 的 代码 将 会 打印 5682， 因 
为 i 和 k 通 过 引用 捕捉 ， 而 j 是 复制 的 。 


int main() 


{ 
int i=1234,J=5678,k=9; 
std::function«int()» f=[&i,j,&k] {return i+j+k;}; 
i=l? 
j=2; 
k=3; 
std: :cout<<f ()<<std: :endl; 
} 


最 后 这 个 变化 形式 允许 你 确保 只 有 意料 之 中 的 变量 被 捕捉 ， 因 为 引用 任何 不 
在 捕捉 列表 中 的 局 部 变量 都 会 导致 编译 时 错误 。 如 果 你 选择 了 这 个 选项 ， 而 包含 
lambda 的 函数 又 是 一 个 成 员 函 数 ， 你 就 得 小 心地 访问 类 成 员 。 


类 成 员 不 能 被 直接 捕 提 ， 如 果 你 希望 从 lambda 中 访问 类 成 员 ， 你 必须 将 this 
指针 添加 到 捕捉 列表 中 先行 捕捉 。 在 下 面 的 例子 中 ，lambda 捕 捉 了 this， 以 允许 


访问 类 成 员 some_data。 


struct X 


{ 
int some data; 
void foo(std::vector<int>& vec) 
{ 
std: :for_each(vec.begin() ,vec.end(}, 
[this] (int& i){i+=some_data;}); 
} 
E 


在 并 发 的 上 下 文中 ，lambda 表 达 式 最 大 的 用 处 是 作 
为 std: :condition variable: :wait() (参见 4.1.1 节 ) 以 及 
std::packaged task«» (参见 4.2.1 节 ) 的 断言 ， 或 是 打包 小 任务 的 线程 池 。 它 
们 也 能 作为 线程 函数 〈 参 见 2.1.1 节 ) 传 给 std: :thread 的 构造 函数 ， 或 是 作为 使 
用 并 行 算法 的 函数 ， 比 如 parallel_for_each() (参见 8.5.1 节 ) 。 


A6 AES X 


变 参 模 板 ， 指 的 是 参数 数量 可 变 的 模板 。 正 如 你 一 直 以 来 使 用 的 变 参 函 数 一 
样 ， 比 如 printf 就 可 以 接受 可 变数 量 的 参数 ， 你 现在 有 了 模板 参数 数量 可 变 的 变 
参 模 板 。 变 参 模板 的 使 用 贯穿 整个 C++ 线程 库 。 比 如 ，std: :thread 用 来 启动 线 
程 的 构造 函数 〈 参 见 2.1.1 节 ) 就 是 一 个 变 参 函数 模 
板 ，std: :packaged_task<> (参见 4.2.2 节 ) 是 一 个 变 参 类 模板 。 从 使 用 者 的 角 
度 来 看 ， 知 道 这 个 模板 可 以 接受 不 限 数量 的 参数 就 足够 了 ， 但 如 果 你 想 编 写 一 个 
这 样 的 模板 ， 或 者 你 对 它 是 如 何 工 作 的 感 兴趣 ， 你 就 需要 知道 其 中 的 细节 。 


变 参 函数 是 通过 函数 参数 列表 中 的 省 略 号 〈...) 来 声明 的 ， 与 之 类 似 ， 变 
参 模板 的 声明 方式 ， 是 在 模板 参数 列表 中 的 省 略 号 。 


template<typename ... ParameterPack> 
class my template 


TE 


你 也 可 以 在 模板 侦 特 化 中 使 用 变 参 模板 ， 即 便 是 主 模板 并 非 变 参 的 。 比 
iil, std::packaged task«» (参见 4.2.1 节 ) 的 主 模板 只 是 一 个 带 有 单个 模板 参 
数 的 简单 模板 。 
template<typename FunctionType> 
class packaged task; 
" 然而 ， 该 主 模 板 没 有 在 任何 地 方 进行 定义 ， 它 仅仅 是 作为 偏 特 化 的 占 位 标 


JA 


template<typename ReturnType, typename ... Args> 
class packaged task<ReturnType (Args...) >; 


正 是 这 一 偏 特 化 里 包含 了 该 类 的 真正 定义 。 在 第 4 章 中 ， 你 见 过 这 样 的 写 
法 ， 用 std: :packaged_task<int(std::string，double)> 来 声明 一 个 在 调用 
时 接受 std: :string 和 double 作 为 参数 的 任务 ， 然 后 通过 std: :future<int> 提 
供 结 


该 声明 展示 了 变 参 模板 的 另外 两 项 特性 。 第 一 个 特性 相对 简单 ， 你 可 以 在 一 
个 声明 中 同时 包含 普通 的 模板 参数 〈 比 如 ReturnType) 和 变 参 (Args) 。 第 二 
个 特性 演示 了 在 特 化 的 模板 参数 列表 中 Args. . .的 用 法 ， 显 示 了 当 模 板 实例 化 时 
组 成 Args 的 类 型 会 在 这 里 列 出 。 事 实 上 由 于 这 是 俩 特 化 ， 它 按照 模式 匹配 来 工 
VE; 在 实际 的 实例 化 中 ， 此 上 下 文中 出 现 的 类 型 会 被 捕捉 为 Args。 变 参 Args 称 为 
参数 包 (parameterpack) ， 而 对 Args... 的 使 用 称 为 包 展 开 Cpackexpansion) 。 


与 变 参 函数 类 似 ， 变 参 部 分 既 可 以 是 空 列表 也 可 以 有 很 多 条 目 。 比 如 ， 
在 std: :packaged_task<my_class()> 中 ReturnType 参 数 是 my_class，Args 参 
数 包 是 空 的 ， 然 而 在 std: :packaged_task<void(int,，double, my_class&, 
std::string*)> 中 ReturnType 是 void, Args 
是 int、double、my_class&、std::string* 的 列表 。 


展开 参数 包 


变 参 模板 的 强大 之 处 ， 体 现在 你 如 何 去 进 行 包 的 展开 ， 即 你 并 不 局 限于 仅仅 
将 类 型 列表 原样 展开 。 首 先 ， 你 可 以 在 任何 需要 类 型 列表 的 地 方 直接 使 用 包 展 
开 ， 比 如 男 一 个 模板 的 参数 列表 。 


template<typename ... Params> 
struct dummy 
std: :tuple<Params...> data; 


在 这 个 例子 中 ， 唯 一 的 成 员 变 量 data 是 std: :tuple<> 的 一 个 实例 ， 它 包含 
了 所 有 指定 的 类 型 ， 所 以 dummy<int，double，char> 拥 有 类 型 
为 std: :tuple<int，double，char> 的 成 员 。 你 可 以 用 普通 类 型 来 整合 包 展 
FFs 


template<typename ... Params> 
struct dummy2 
std: :tuple<std::string, Params...> data; 


这 一 次 ， 此 元 组 有 一 个 额外 的 (第 一 个 ) std: : string 类 型 的 成 员 。 有 趣 的 
部 分 是 你 可 以 使 用 包 展 开创 建 一 个 模式 ， 它 接 下 来 会 针对 每 一 个 展开 的 元 素 复 
制 。 你 通过 将 标识 包 展 开 的 .… 放 到 模式 的 末尾 来 做 到 这 一 点 。 例 如 ， 不 是 仅 创 建 
你 的 参数 包 里 提供 的 元 素 元 组 ， 而 是 可 以 创建 指向 这 些 元 素 的 指针 元 组 ， 或 者 其 
至 指向 你 的 元 素 的 std: :unique_ptr<> 元 组 : 


template<typename ... Params> 
struct dummy3 
std::tuple<Params* ...> pointers; 
std::tuple<std: :unique ptr«Params» ...» unique pointers; 


}; 


类 型 表达 式 可 以 如 你 所 想 的 那样 复杂 ， 前 提 是 参数 包 出 现在 类 型 表达 式 中 ， 
并 且 该 表达 式 后 面 跟着 标识 展开 的 .…...。 当 参数 包 被 展开 时 ， 包 里 的 每 一 项 会 代 
入 类 型 表达 式 ， 以 生成 结果 列表 中 的 相应 项 。 因 此 ， 如 果 你 的 参数 包 Params 包 
含 int, int,char 的 类 型 ， 那 
Astd::tuple<std: :pair<std::unique_ptr<Params>,double> > 的 展开 就 
是 std: :tuple<std::pair<std::unique_ptr<int>,double>,std::pair<std 
如 果 包 展开 被 用 作 模 板 参 数列 表 ， 该 模板 无 需 具有 变 参 ， 但 如 果 它 确实 没有 ， 那 
么 包 的 大 小 必须 恰好 匹配 模板 参数 要 求 的 数量 。 


template<typename ... Types> 
struct dummy4 


{ 
std: :pair<Types...> data; I B ei-oa 
} ; ta, data 是 std::pair 
dummy4<int,char> a; «— <int.char> ó 错误 ， 没 有 第 二 个 
dummy4<int> b; e 错误 ， 类 型 过 多 < 类 型 


dummy4<int,int,int> c; 


你 可 以 对 包 展 开 做 的 第 二 件 事情 ， 是 用 它 来 声明 一 个 函数 参数 列表 。 


template<typename ... Args> 
void foo(Args ... args); 


这 样 创建 一 个 新 的 参数 包 args， 它 是 函数 参数 的 列表 而 不 是 类 型 的 列表 ， 你 
可 以 像 之 前 那样 用 . . .来 展开 它 。 现 在 ， 你 可 以 用 带 有 包 展 开 的 模式 来 声明 函数 
参数 ， 正 如 你 在 其 他 地 方 使 用 的 展开 包 模 式 一 样 。 比 如 ，std: :thread 利 用 它 来 
通过 右 值 引用 接受 所 有 的 函数 参数 〈 参 见 A.1 节 ) : 


template<typename CallableType,typename ... Args> 
thread: :thread(CallableTypeé&& func,Args&& ... args); 


这 个 函数 参数 包 可 以 用 来 通过 在 被 调用 函数 的 参数 列表 里 指定 包 展 开 ， 来 调 
用 另 一 个 函数 。 正 如 类 型 展开 一 样 ， 你 可 以 为 结果 参数 列表 里 的 每 个 表达 式 使 用 
一 个 模式 。 例 如 ， 一 个 常见 的 右 值 引用 习惯 用 法 是 使 用 std: :forward<> 来 保持 
所 提供 函数 参数 的 右 值 性 : 


template<typename ... ArgTypes> 
void bar (ArgTypes&& ... args) 
{ 


foo(std::forward«ArgTypes»(args)...); 


j 


注意 在 这 个 例子 里 ， 包 展开 同时 包含 了 类 型 包 ArgTypes 和 函数 参数 
包 args， 以 及 整个 表达 式 后 面 的 省 略 号 。 如 果 你 像 这 样 调用 bar: 


inn 1i 
bar(i,3.141,std::string("hello ")); 


那么 展开 成 为 : 


template<> 
void bar<intg&,double,std: :string> ( 
int& args 1, 
double&& args 2, 
std::string&& args 3) 
( 
foo (std: :forward<int&>(args_1), 
std: :forward<double>(args_ 2), 
std: :forward<std::string>(args_3)); 


人 
站 参数 。 


你 可 以 对 参数 展开 做 的 最 后 一 件 事 是 使 用 sizeof.. .操作 符 来 获取 其 大 小 。 
这 是 非常 简单 的 : sizeof. ..(p) 就 是 参数 包 p 中 的 元 系 个 数 。 无 论 是 类 型 参数 包 
还 是 函数 参数 包 ， 结 果 都 是 一 样 的 。 这 可 能 是 唯一 一 个 你 可 以 使 用 参数 包 并 且 不 
在 后 面 跟 上 省 略 号 的 情况 ， 省 略 号 已 经 是 sizeof. . .运算 符 的 一 部 分 。 下 面 的 函 
数 返回 提供 给 它 的 参数 个 数 : 


template<typename ... Args> 
unsigned count args (Args ... args) 


{ 
} 


return sizeof... (Args); 


如 同 普通 的 sizeof 运 算 符 ，sizeof. . .的 结果 是 一 个 常量 表达 式 ， 所 以 它 可 
以 被 用 来 指定 数组 的 边界 等 等 。 


A. 目 动 推 关 变量 的 类 型 


C++ 是 一 门 静 态 类 型 语言 ， 每 个 变量 的 类 型 在 编译 时 都 是 已 知 的。 不 仅 如 
此 ， 作 为 程序 员 ， 你 还 得 指定 每 个 变量 的 类 型 。 在 某 些 情况 下 ， 这 将 导致 非常 笨 
HEF Pu, 


std: :map<std: :string, std: :unique_ptr<some_data>> m; 
std::map«std::string,std::unique ptr<some data>>: :iterator 
iter=m,find("my key"); 


传统 上 ， 有 个 解决 方案 那 就 是 使 用 typedef 来 减少 类 型 标识 符 的 长 度 ， 并 有 
可 能 消除 类 型 不 一 致 的 问题 。 这 在 C++11 中 仍然 有 效 ， 但 现在 有 了 一 种 新 的 方 
式 ， 如 果 一 个 变量 在 其 声明 中 初始 化 自 一 个 相同 类 型 的 值 ， 那 么 你 可 以 将 类 型 指 
定 为 auto。 在 这 种 情况 下 ， 编 译 器 将 自动 推 类 变量 的 类 型 与 初始 化 器 相同 。 于 
er IS RS Bil n] EAE E: 


auto iter=m.find("my key"); 


现在 ， 你 不 限于 只 是 普通 的 auto， 你 可 以 修饰 它 来 声明 const 变 量 、 指 针 或 
引用 变量 。 这 里 有 几 个 使 用 auto 的 变量 声明 及 其 相应 的 变量 类 型 : 


auto i=42; zT int 
auto& j=i; A/ integ 
auto const k=i; // int const 


auto* const p-&i; // int * const 


FET AS RE ASTU ANUU, AE FAR A PE ET EI: BRAC HY 
参数 。 在 形 如 下 面 格式 的 声明 中 : 


some-type-expression-involving-auto var=some-expression; 
varh KA 55 EH IB] GA SHED HH Ps AS OH ER], XC ITE Tato 

换 成 了 模板 参数 的 名 字 : 

template<typename T> 

void f(type-expression var); 

f (Some-expression) ; 


这 意味 着 数组 类 型 衰变 到 指针 和 引用 都 被 丢弃 ， 除 非 该 类 型 表达 式 显 式 声明 
变量 为 引用 ， 例 如 : 


int some array[45]; 


auto p-some array; Pf int* 
inta. r=*p; 

auto xzr; Lf int 
auto& yzr; // int& 


这 可 大 大 简化 变量 的 声明 ， 特 别 是 完整 的 类 型 标识 符 很 长 ， 或 者 干脆 不 可 知 
例如， 在 一 个 模板 中 的 函数 调用 的 结果 的 类 型 ) 。 


A.8 线程 局 部 变量 


线程 局 部 变量 可 以 在 程序 中 让 你 为 每 个 线程 拥有 独立 的 变量 实例 。 在 声明 变 
量 时 ， 可 以 用 thread_local 关 键 字 进行 标记 ， 表 明 它 是 线程 局 部 的 。 命 名 空间 
范围 的 变量 、 类 的 静态 数据 成 员 和 局 部 变量 都 可 被 声明 为 线程 局 部 的 ， 也 就 是 
说 ， 具 有 线程 存储 期 (threadstorageduration) 。 


命名 空间 范围 内 的 线 
thread_local int x; 2 : 4 
read_local int x 程 局 部 变量 
sdb 线程 局 部 的 静态 类 数 
据 成 员 
static thread_local std::string s; < EH Xs 的 
; md ee XS 
static thread local std::string X::s; E 定义 


void foo() 


{ lim 
ms b 
thread_local std::vector<int> v; 变量 


} 


命名 空间 范围 的 线程 局 部 变量 和 线程 局 部 的 静态 类 数据 成 员 ， 在 相同 的 翻译 
单元 里 的 首次 使 用 之 前 被 构造 ， 但 并 没有 指定 要 提前 多 久 。 有 些 实现 方式 可 能 在 
线程 局 动 时 构造 线程 局 部 变量 ， 有 些 则 可 能 在 他 们 被 各 自 线 程 初 次 使 用 之 前 就 立 
即 构造 了 了， 还 有 些 可 能 在 其 他 的 时 点 进行 构造 ， 或 是 根据 其 用 途上 下 文 的 某 种 组 
合 。 事 实 上 ， 如 果 没 有 一 个 来 自给 定 的 翻译 单元 的 线程 局 部 变量 被 使 用 ， 则 压根 
就 不 会 保证 他 们 会 被 构造 。 这 就 允许 动态 加 载 的 模块 包含 线程 局 部 变量 一 一 这 些 
变量 可 以 在 来 自动 态 加 载 模块 的 线程 首次 引用 线程 局 部 变量 的 时 候 被 构造 。 


在 函数 内 声明 的 线程 局 部 变量 ， 是 在 给 定 线程 的 控制 流 第 一 次 通过 其 声明 时 
初始 化 的 。 如 果 不 由 给 定 的 线程 调用 该 函数 ， 则 函数 内 的 任何 线程 局 部 变量 都 不 
被 构造 。 这 一 行为 与 局 部 静态 变量 是 一 样 的 ， 区 别 在 于 它 分 别 适 用 于 每 个 线程 。 


线程 局 部 变量 与 静态 变量 共享 其 他 属性 一 一 他 们 在 所 有 进一步 初始 化 (如 动 
态 初始 化 ) 之 前 是 零 初始 化 的 。 如 果 线 程 本 地 变量 的 构造 引发 异常 ， 则 调 
用 std: :terminate() 来 中 止 应 用 程序 。 


所 有 在 给 定 线程 上 构造 的 线程 局 部 变量 的 析 构 函数 ， 运 行 于 在 线程 函数 返回 
时 ， 与 构造 函数 是 相反 的 顺序 。 由 于 初始 化 的 顺序 是 未 指定 的 ， 因 此 确保 这 种 变 
量 的 析 构 函数 之 间 没 有 相互 依存 关系 是 很 重要 的 。 如 果 一 个 线程 局 部 变量 的 析 构 
函数 以 异常 退出 ，std: :terminate() 会 被 调用 ， 与 构造 相 类 似 。 


如 果 一 个 线程 调用 std: :exit() 或 从 main() 返 回 ( 等 效 于 以 main( ) 的 返回 
值 调用 std: :exit()) ， 那 么 该 线程 的 线程 局 部 变量 也 会 被 销毁 。 如 果 任 何其 他 


虽然 线程 局 部 变量 的 每 个 线程 上 有 一 个 不 同 的 地 址 ， 你 仍然 可 以 获得 指 癌 这 
种 变量 的 普通 指针 。 该 指针 将 引用 拥有 该 地 址 的 线程 中 的 对 象 ， 并 可 以 用 来 允许 
其 他 线程 访问 该 对 象 。 在 一 个 对 象 被 销毁 后 再 去 访问 它 是 未 定义 的 行为 《一 直 都 
是 ) ， 所 以 如 果 将 指向 一 个 线程 局 部 变量 的 指针 传 给 男 一 个 线程 的 线程 ， 你 需要 
确保 它 在 其 所 属 线程 结束 后 不 被 解 引用 。 


AQ 小 结 


本 附录 只 是 路 了 一 下 C++ 标准 引入 的 新 语言 特性 的 皮毛 ， 因 为 我 们 只 看 了 那 
些 对 Thread 库 有 积极 影响 的 功能 。 其 他 新 的 语言 功能 包括 静态 断言 、 强 类 型 的 榴 
举 、 委 派 构造 稍 数 、Unicode 文 持 、 模 板 别名 和 一 个 新 的 统一 的 初始 化 序列 ， 以 及 
一 系列 较 小 变化 。 描 述 所 有 新 功能 的 详细 信息 不 在 本 书 的 范围 之 内 ， 可 能 需要 另 
一 本 专门 的 书 。 目 前 ， 对 完整 的 标准 变更 最 好 的 概览 ， 大 概 是 Bjarne Stroustrup 的 
C++11 常 见 问题 解答 品 ， 而 流行 的 C++ 参考 书 为 了 涵盖 它 会 及 时 地 作出 修订 。 


希望 本 附录 中 所 涵盖 的 新 功能 简介 提供 了 足够 的 深度 ， 以 展示 它们 与 Thread 
库 有 着 怎样 的 关系 ， 并 使 你 能 够 编写 和 理解 使 用 这 些 新 功能 的 多 线程 的 代码 。 虽 
然 本 附录 本 应 为 这 些 特性 所 涵盖 简单 用 途 提 供 足 够 的 深度 ， 但 这 仍然 只 是 一 份 简 
介 ， 并 不 是 使 用 这 些 功能 的 完整 的 参考 或 教程 。 如 果 你 打算 将 它们 广泛 地 使 用 ， 
我 建议 获取 一 份 这 样 的 参考 或 教程 ， 以 便 从 中 获得 最 大 的 益处 。 


[1] http://www.research.att.com/~bs/C++0xFAQ.html 


附录 也 


C++ 标准 中 得 到 支持 。 比 如 ，Java 上 自发 布 起 就 拥有 多 线程 支持 ， 兼 容 POSIX 标 准 


的 平台 提供 了 用 于 多 线程 的 C 语 言 接 口 ，Erlang 提 供 了 信息 传递 并 发 的 支持 。 甚 至 


并 有 发 关 库 简要 对 比 


编程 语言 和 类 库 对 并 发 与 多 线程 的 支持 并 非 新 生 事物 ， 它 们 只 是 最 近 才 在 


还 有 些 类 似 Boost 一 样 的 C++ 库 ， 将 各 种 平台 的 底层 多 线程 编程 接口 (POSIX C 
口 或 其 他 ) 进行 了 封装 ， 具 备 跨 平台 的 可 移植 性 。 


对 那些 已 经 有 多 线程 应 用 编写 经 验 ， 并 且 希 望 利用 这 些 经 验 来 使 用 新 的 
C++ 多 线程 工具 编写 代码 的 人 而 言 ， 本 附录 提供 了 Java、POSIX C、C++ Boost 线 


程 库 与 C++11 中 可 用 工具 的 对 比 ， 同 时 包括 本 书 中 相关 章 


节 的 交叉 引用 。 


功能 Java POSIX C Boost threads 
pthread_t 类 型 和 相关 API 
启动 | J 函数 : pthread create(). , M TTE 
线程 java.lang.thread 类 pthread. detach()fi boost::thread 类 与 成 员 函 数 | std 
pthread join() 
类 型 
Sane Fa ae 型 和 相 boost::mutex 类 与 成 员 函 数 ，| std 
互 斥 | synchronized 块 boost::lock_guard<> 和 std 
pthread_mutex_lock()、 ne a ad 
pthread mutex, unlock()55 nii 
pthread_cond_t 类 型 与 相 
监控 / | java.lang.0bject 类 的 wait() 和 RAPI ŽU: boost::condition_variable 和 | std 
等 待 | notify() 方 法 ， 在 synchronized 块 内 使 | pthread. cond, wait(). boost::condition_variable_any | std 
预期 | 用 pthread cond timed wait() | 类 与 成 员 函 数 类 . 
A 
Br 
n " std 
un volatile 变 量 ， 位 于 < z std 
java.util.concurrent.atomic £l rH 个 可 用 个 四 用 std 
i PR: 
存 模 


java.util.concurrent £l FF [f] 容器 


java.util.concurrent.futurefz O fH 2& 
类 


java.util.concurrent. ThreadPoolExecutor 
S 


java.lang.Thread[lJinterrupt() 77 17; 


不 可 用 


不 可 用 


pthread_cancel() 


不 可 用 不 


boost::unique_future<> 和 
boost::shared_future<> 类 模 


boost::thread 类 的 interruptO 


MRC 消 妃 传递 框架 与 完整 的 ATMI 示 
例 


在 第 4 章 中 ， 我 展示 了 一 个 在 线程 之 间 使 用 消息 传递 框架 来 传递 消息 的 例 
To 其 下 简单 实现 了 ATM 中 的 代码 。 下面 给 出 该 示例 的 完整 代码 ， 其 中 包含 了 消 
息 传递 框架 。 


清单 C.1 展 示 了 消息 队列 。 其 中 以 指向 基 类 的 指针 存放 了 一 列 消息 ， 特 定 的 消 
息 类 别 使 用 从 该 基 类 派生 的 类 模板 来 处 理 。 压 入 一 个 条 目 ， 即 是 构造 一 个 包装 类 
的 相应 实例 并 且 存 储 一 个 指向 它 的 指针 。 弹 出 一 个 条 目 ， 即 是 返回 该 指针 。 由 于 
message_base 类 没有 任何 成 员 函 数 ， 弹 出 线程 在 能 够 访问 存储 的 消息 之 前 ， 需 
要 将 此 指针 转换 为 一 个 合适 的 wrapped_message<T> 指 针 。 


清单 C.1 简单 的 消息 队列 


#include <mutex> 
#include <condition variable> 
#include <queue> 


#include <memory> 
namespace messagin T A 
E D 我 们 的 队列 项 目的 
| 基 类 
struct message_base qt ex 


virtual -message base() 
f 
{ 


template<typename Msg> 


struct wrapped_message: 每 个 消息 类 型 有 特殊 
message_base * 定义 
{ 


Msg contents; 


explicit wrapped message(í(Msg const& contents ): 
contents (contents ) 
ü 


}; 我 们 的 消息 
队列 


class queue 
i std: :mutex m; 实际 的 队列 存储 message_ 
std::condition variable c; base 的 指针 
std: :queue<std: :shared ptr«message base» > q; 
public: 
template<typename T> 将 发 出 的 消 
void push(T const& msg) EHEHEH 
存储 指针 
std::lock guard<std: :mutex> 1k(m) ; 
q.push(std::make_shared<wrapped_message<T> >{msg)); 
c.notify all(); 


std::shared ptr«message base» wait and Pop () 


std: :unique lock«std::mutex» lk(m); FEE PLI BRI 
c.wait (1k, [&] {return !q.empty();}); apa 

auto res-q.front(); 

q.pop(); 


return res; 


发 送 消息 是 通过 清单 C.2 所 示 的 sender 类 实例 来 处 理 的 。 它 仅仅 是 对 消息 队 


列 的 简单 包装 ， 只 人 允许 消息 被 压 入 。 复 制 sender 的 实例 仅仅 复制 指向 队列 的 指 
fF. MAE SA 


清单 C.2 sender% 


namespace messaging 


{ 


class sender 


{ sender 就 是 封装 了 队 
queue*q; 列 指 针 
public: 默认 构造 的 sender 没 
sender (): 有 队列 
q(nullptr) 
Ü 允许 从 指向 队列 的 指 
explicit sender (queue*q ): 针 进 行 构造 


q(q_) 
{} 


template<typename Message> 
void send(Message const& msg) 
{ 
if (q) os ada 
在 队列 上 发 送 推送 
q-»push (msg) ; «4 消息 
} 


接收 消息 要 稍微 复杂 一 点 。 你 不 仅 要 等 待 队列 中 的 消 轧 ， 还 需要 检查 其 类 型 
是 否 符合 所 等 待 的 消息 类 型 ， 并 且 调用 相应 的 处 理 函 数 。 这 些 都 始 于 清单 C.3 中 展 


示 的 receiver 类 。 


清单 C.3” receiver% 


namespace messaging 


{ 


class receiver 


[ | 一 个 receiver 拥有 

queue q; a 此 队列 允许 隐 式 转换 到 引用 队 
public: | 列 的 sender 

operator sender () < 


{ 
} 


dispatcher wait () 


{ 
} 


return sender (&q) ; 
" 等 待 队 列 创 建 
al 调度 器 


return dispatcher (&q) ; 


与 sender 仪 仅 引 用 一 个 消息 队列 不 同 ，receiver 拥 有 它 。 你 可 以 使 用 隐 式 
转换 来 获得 一 个 引用 该 队列 的 sender 类 。 进 行 消息 调度 的 复杂 性 始 于 对 wait() 
的 调用 ， 这 将 创建 一 个 dispatcher 对 象 ， 它 从 receiver 中 引用 该 队 
列 。dispatcher 类 展示 在 下 一 个 清单 中 ， 正 如 你 所 见 ， 这 项 工作 是 在 析 构 函数 
中 完成 的 。 在 清单 C.4 的 例子 中 ， 此 工作 是 由 等 待 消息 和 调度 消息 组 成 的 。 


清单 C.4 dispatcher% 
namespace messaging 
í N 用 来 关闭 队列 的 
class close_queue < 消息 


{}; 


class dispatcher 


{ 


queue* q; 

bool chained; 不 能 复制 的 调度 器 
dispatcher (dispatcher const&)-delete; a! 实例 
dispatcher& operator=(dispatcher const&) =delete; 


template< 
typename Dispatcher, x : 
typename Msg, | 允许 TemplateDispatcher 实例 访 
typename Func> < 一 问 内 部 成 员 
friend class TemplateDispatcher; 
void wait and dispatch() 
( adr 循环 、 等 待 和 
for(;;) : 调度 消息 
{ 
auto msgsq-»wait and pop(); 
t " 
i dispatch (msg) ; dispatch) Kt t close queue 消息 ， 
} HE Hs 
bool dispatch( < 
std::shared ptr«message base» const& msg) 
( 


if (dynamic_cast<wrapped_message<close_queue>*>(msg.get())) 


{ 
} 


return false; 


throw close queue(); 


) 


public: 调度 器 实例 可 以 

dispatcher (dispatchersé& other): a 被 移动 

q{other.g), chained (other. chained) 
{ 
; other.chained-true; 来 源 不 得 等 待 

消息 

explicit dispatcher(queue* q_): 

qiq_), chained (false) 
template<typename Message,typename Func> "T 使 用 TemplateDispatcher 
TemplateDispatcher<dispatcher, Message, Func> 处 理 特定 类 型 的 消息 
handle (Func&& f) 


{ 
return TemplateDispatcher<dispatcher, Message, Func> ( 
q, this, std: :forward<Func>(f)) ; 


} 


~dispatcher{) noexcept (false) 4 -icine Bis 
( 析 构 函数 可 能 抛 出 
if (!chained) 异常 


{ 
} 


wait_and_dispatch(); 


从 wait() 返 回 的 dispatcher 实 例 将 会 被 立刻 销毁 ， 因 为 它 是 临时 的 ， 并 且 
如 前 所 述 ， 析 构 函 数 承担 了 这 项 工作 。 析 构 函 数 调用 wait_and_dispatch()， 这 
是 一 个 等 待 消息 并 将 其 传递 给 dispatch( ) 的 循环 @。dispatch() 本 身 @ 非 常 简 
单 ， 它 检查 消息 是 否 为 一 个 close_queue 消 息 ， 如 果 是 ， 就 抛 出 一 个 异常 ; 8 
则 ， 它 返回 false 来 指示 该 消息 未 被 处 理 。close_queue 异 常 正 是 析 构 函数 被 标 
记 为 noexcept(false) 的 原因 ; 如 果 没 有 这 个 注解 ， 析 构 函 数 的 默认 异常 规定 将 
会 是 noexcept(true)@@， 表 明 没 有 异常 能 够 被 抛 出 ， 那 么 close_queue 异 常 就 
会 终止 程序 。 


然而 你 并 非 经 常 去 主动 调用 wait()， 大 部 分 时 间 你 会 希望 去 处 理 一 个 消息 。 
这 就 是 handle() 成 员 函 数 @ 的 用 武之 地 。 它 是 一 个 模板 ， 并 且 消 息 类 型 是 无 法 推 
断 的 ， 所 以 你 必须 指定 待 处 理 的 消息 类 型 ， 并 且 传 入 一 个 函数 (或 者 可 调用 的 对 
R) 来 处 理 它 。handle() 自 身 将 队列 、 当 前 的 dispatcher 对 象 和 处 理 函 数 传递 
给 一 个 新 的 TemplateDispatcher 类 模板 的 实例 ， 来 处 理 指定 类 型 的 消息 ， 这 些 
展示 在 清单 C.5 的 例子 中 。 为 什么 要 在 等 待 消息 之 前 就 在 析 构 函数 里 测试 chained 
的 值 呢 ? 因为 这 样 不 仅 可 以 防止 移入 的 对 象 等 待 消息 ， 而 且 人 允许 你 将 等 待 消息 的 
重任 交 给 新 的 TemplateDispatcher 实 例 。 


清单 C.5 ” ”TemplateDispatcher 类 模板 


namespace messaging 
{ 
template<typename PreviousDispatcher,typename Msg,typename Func> 
class TemplateDispatcher 
{ 
queue* q; 
PreviousDispatcher* prev; 
Func f; 
bool chained; 


TemplateDispatcher(TemplateDispatcher const&)-delete; 
TemplateDispatcher& operator=(TemplateDispatcher const&)sdelete; 
template<typename Dispatcher,typename OtherMsg,typename OtherFunc» 
friend class TemplateDispatcher; 4m 5 iis ` À 

p p TemplateDispatcher 实例 之 间 互 为 
友 元 


void wait and dispatch() 
( 
\ 

forí;:) 


{ n igh GALT > 
auto msgsq-»wait and pop(); 如 果 我 们 处 理 了 消息 ， 


if (dispatch (msg) ) «4 跳出 循环 
break; 
} 
} 
bool dispatch(std::shared ptr«message base» const& msg) 


{ 


if (wrapped_message<Msg>* wrapper= 


dynamic cast«wrapped message«Msg»*»(msg.getí))) < 
{ 
f (wrapper->contents) ; 检查 消息 类 型 并 
return true; 调用 函数 e 
) 
else 
{ 链 至 前 一 个 
return prev->dispatch (msg); + 调度 器 
} 


public: 

TemplateDispatcher (TemplateDispatcher&& other): 
q(other.q),prev(other.prev),f(std::move(other.f])), 
chained (other.chained) 

( 


other.chained=true; 
i 
TemplateDispatcher(queue* q ,PreviousDispatcher* prev ,Func&& f ): 


qía ),preví(prev ),fí(std::forward«Func»(f )),chained(false) 


prev -»chained-true; 


template<typename OtherMsg,typename OtherFunc» 
TemplateDispatcher«TemplateDispatcher,OtherMsg,OtherFunc» 


handle (OtherFunc&& of) 
return TemplateDispatcher< ji 可 以 链接 附加 的 
TemplateDispatcher, OtherMsg, OtherFunc> ( 处 理 函 数 
q, this, std: :forward<OtherFuncs (of) ); 
~TemplateDispatcher() noexcept (false) <a 


if (!chained) 析 构 函数 又 是 
{ 8 noexcept(false) 的 


wait and dispatch(); 


TemplateDispatcher<> 类 模板 是 基于 dispatcher 类 构建 的 ， 并 且 二 者 几 
乎 雷同 。 尤 其 是 析 构 函数 仍然 调用 了 wait_and_dispatch() 来 等 待 一 个 消息 。 


如 果 你 处 理 了 消息 ， 那 么 就 不 会 抛 出 异常 ， 所 以 你 需要 在 消息 循环 @ 中 检查 
你 是 否 真 的 处 理 了 消息 。 当 你 成 功 处 理 了 消息 时 ， 消 息 处 理 即 行 停止 ， 你 就 可 以 
等 待 下 一 时 刻 的 另 一 组 消息 。 如 果 你 恰好 得 到 了 一 条 匹配 的 消息 类 型 ， 那 么 所 提 
供 的 函数 就 会 被 调用 全， 而 不 是 抛 出 异常 (尽管 处 理 函 数 自身 可 能 会 抛 出 异 
常 )。 如 果 没 有 得 到 匹配 的 消息 ， 那 么 就 链接 至 前 一 个 dispatcher 合 。 在 首 个 
实例 中 ， 它 就 是 dispatcher， 但 如 果 你 将 调用 链接 至 handle() 函 数 四 ， 以 允许 
多 种 类 型 的 消息 被 处 理 ， 这 可 能 会 先 于 TemplateDispatcher<> 初 始 化 ， 如 果 消 
上 不 匹配 的 话 ， 这 将 会 反 过 来 链接 到 前 一 个 句柄 上 。 因 为 所 有 句柄 都 可 能 引发 异 
常 ( 包 括 dispatcher 为 close_queue 消 息 的 默认 句柄 ) ， 析 构 函 数 必 须 再 次 声 
明 为 noexcept(false) 回 . 


这 个 简单 的 框架 允许 你 将 任意 类 型 的 消息 压 入 队列 中 ， 然 后 在 接收 端 有 选择 
地 匹配 你 能 够 处 理 的 消息 。 它 同时 允许 你 为 了 压 入 消息 而 绕 过 对 队列 的 引用 ， 同 


时 保持 接收 端的 私密 性 。 


为 了 完成 第 4 章 中 的 示例 ， 在 清单 C.6 中 给 出 了 消 轧 ， 清 单 C.7、 清 单 C.8 和 清 
单 C.9 中 给 出 几 种 状态 机 ， 驱 动 代码 在 清单 C.10 中 给 出 。 


清单 C.6” ”ATM 消息 


struct withdraw 
std::string account; 
unsigned amount; 
mutable messaging::sender atm queue; 


withdraw(std::string const& account , 
unsigned amount , 
messaging::sender atm queue ): 

account íaccount ),amountí(amount ), 
atm queue(atm queue | 


{} 
): 
struct withdraw ok 
(hi 
struct withdraw_denied 
{hi 


struct cancel withdrawal 


{ 


std::string account; 
unsigned amount; 


cancel withdrawal (std::string const& account , 
unsigned amount ) : 
account (account_),amount (amount_) 


{f 
bi 


struct withdrawal_processed 


{ 


std::string account; 
unsigned amount; 


withdrawal_processed(std::string const& account , 
unsigned amount ): 
account (account ),amount (amount ) 


Ü 


struct card_inserted 


{ 


std::string account; 


explicit card inserted(std::string const& account ): 
account (account ) 
{} 


struct digit pressed 


{ 


char digit; 


explicit digit pressed(char digit ): 
digit (digit ) 
{} 


} 

struct clear_last_pressed 
{ 

struct eject card 

{ 


struct withdraw_pressed 


{ 


unsigned amount; 


explicit withdraw pressed(unsigned amount ): 
amount (amount ) 


{} 
y; 


struct cancel_pressed 


Us 


struct issue money 
unsigned amount; 
issue money(unsigned amount ): 
amount (amount ) 
{} 


): 
struct verify pin 
std::string account; 
std::string pin; 
mutable messaging::sender atm queue; 


verify pin(std::string const& account ,std::string const& pin , 
messaging::sender atm queue ): 
account(account ),pin(pin ),atm queue(atm queue ) 


struct pin verified 


{ 


struct pin incorrect 


{}; 


struct display_enter_pin 


{}; 


struct display enter card 


Us 


struct display insufficient funds 


{ 


struct display withdrawal cancelled 


i 


struct display pin incorrect message 


Lb 


struct display withdrawal options 


Us 


struct get balance 


std::string account; 
mutable messaging::sender atm queue; 


get balance(std::string const& account ,messaging::sender atm queue ): 
accountí(account ),atm queue(atm queue ) 


}; 


struct balance 


{ 


unsigned amount; 


explicit balance (unsigned amount ): 
amount (amount ) 
{} 


b; 


struct display_balance 


{ 


unsigned amount; 


explicit display_balance (unsigned amount ): 
amount (amount ) 


struct balance pressed 


EE 
清单 C.7 ”ATM 状态 机 


class atm 


{ 


messaging: 
messaging: 
messaging: 
void (atm: 


receiver incoming; 

:sender bank; 

‘sender interlace hardware; 
:*state)(); 


std::string account; 
unsigned withdrawal amount; 
std::string pin; 


void process withdrawal (} 
{ 
incoming.wait () 
.handle«withdraw ok»í( 

[&] (withdraw ok const& msg) 

{ 
interface hardware.send( 

issue money (withdrawal amount)); 
bank.send( 

withdrawal processed(account,withdrawal amount)); 
state-&atm::done processing; 

} 

) 

.handle«withdraw denied»( 

[&] (withdraw denied const& msg) 

{ 
interface_hardware.send(display_insufficient_funds())j; 
state-&atm::done processing; 

} 

) 

.handle«cancel pressed»( 

[&] (cancel pressed const& msg) 

( 
bank.send( 

cancel withdrawal (account ,withdrawal amount)); 
interface hardware.send( 

display withdrawal cancelled()); 
sState-&atm::done processing; 


i 
} 


void process balance () 
{ 
incoming. wait ()} 
-handle<balance> ( 
[&] (balance const& msg) 
{ 
interface hardware.send(display balance (msg.amount)); 
State-&atm::wait for action; 
} 
) 
.handle«cancel pressed»( 
[&] (cancel pressed const& msg) 


{ 


state=é&atm: :done_processing; 


E 
} 


void wait for action() 


{ 


interface hardware.send(display withdrawal options()); 
incoming.wait () 
.handle«withdraw pressed-( 
[&] (withdraw pressed const& msg) 
{ 
withdrawal amount-msg.amount; 
bank.send(withdraw(account,msg.amount,incoming)); 
state-&atm::process withdrawal; 
) 
) 
.handle«balance pressed»(í 
[&] (balance pressed const& msg) 
{ 
bank.send(get_balance (account, incoming) ) ; 
state=&atm: :process_balance; 
} 
) 
-handle<cancel_pressed> ( 
[&] (cancel pressed const& msg) 


{ 


state=&atm::done processing; 


1 
} 


void verifying pin() 
{ 
incoming.wait () 
.handle«pin verified»( 
[&] (pin verified const& msg) 


{ 


} 
) 
.handle«pin incorrect»( 
[&] (pin incorrect const& msg) 


{ 


state=&atm: :wait for action; 


interface_hardware.send { 
display pin incorrect message ()); 
State-&atm::done processing; 
} 
) 
-handle<cancel_pressed> ( 
[&] (cancel pressed const& msg) 


{ 


state=&atm: :done_processing; 


di 
} 


void getting pin() 
{ 
incoming.wait () 
.handle«digit pressed»( 
[&] (digit pressed const& msg) 


unsigned const pin_length=4; 

pin+=msg.digit; 

if (pin. length() ==pin_length) 

{ 
bank. send (verify_pin{account,pin, incoming) } ; 
state=&atm:: verifying pin; 


} 
) 
.handle«clear last pressed»( 
[&] (clear last pressed const& msg) 


{ 
if (!pin.empty ()) 


{ 
} 


pin.pop back(); 


} 
) 
.handle«cancel pressed»( 
[&] (cancel pressed const& msg) 


{ 


} 
)i 


sState-&atm::done processing; 


) 


void waiting for card() 
{ 
interface hardware.send(display enter card()); 
incoming.wait () 
.handle«card inserted»( 
[&] (card inserted const& msg) 
{ 
account=msg.account ; 
pans"" 
interface hardware.send(display enter pin()); 
State-&atm::getting pin; 


) 


void done processing() 

{ 
interface hardware.send(eject card()); 
state-&atm::waiting for card; 


) 


atm(atm const&)-delete; 
atm& operator-(atm const&)-delete; 


public: 
atm(messaging::sender bank , 
messaging::sender interface hardware ): 
bank(bank ),interface hardware(interface hardware ) 


{} 


void done() 


{ 
} 


void run() 


{ 


get senderí().send(messaging::close queue()); 


State-&atm::waiting for card; 
try 


{ 
Lor +) 


{ 
} 


(this-»*state)(); 


) 
catch(messaging::close queue const&) 
{ 
} 
} 


messaging::sender get sender () 


{ 
} 


return incoming; 


清单 C.8 ”银行 状态 机 


class bank machine 


{ 


messaging: :receiver incoming; 
unsigned balance; 


public: 
bank machine(): 
balanceí199) 


Ü 


void done() 


{ 
} 


void run() 


{ 


get_sender(} . send (messaging: :close_queue({)); 


try 
{ 
foris 
{ 
incoming. wait () 
.handle«verify pin»( 
[&] (verify pin const& msg) 
{ 


if (msg.pin=="1937") 


{ 
} 


msg.atm queue.send(pin verified()); 


else 


{ 
} 


msg.atm_queue.send(pin_incorrect ()); 


} 
) 
.handle«withdraw»( 
[&] (withdraw const& msg) 


{ 


if (balance>=msg. amount) 


{ 


msg.atm queue.send(withdraw ok()); 
balance-=msg.amount; 


} 


else 


{ 
} 


msg.atm queue.send(withdraw denied()); 


} 
) 
-handle<get_balance> ( 
[&] (get_balance const& msg) 


{ 


} 
) 
.handle«withdrawal processed»( 
[&] (withdrawal processed const& msg) 


{ 
} 
) 
-handle<cancel withdrawal > ( 
[&] (cancel withdrawal const& msg) 
( 


) 
); 


msg.atm queue.send(::balance(balance)); 


) 
} 


catch (messaging: :close_queue const&) 


{ 
} 
} 


messaging::sender get_sender () 


{ 
} 


return incoming; 


}; 


清单 C.9 用 户 界 面 状 态 机 


class interface machine 


messaging: :receiver incoming; 
publics 


void done() 


{ 
} 


void run() 


{ 


get sender().send(messaging::close queue () ) ; 


try 
{ 
for(;;) 
{ 
incoming.wait() 
.handle«issue money»(í 
[&] (issue money const& msg) 
{ 
{ 
std::lock_guard<std: :mutex> lk(iom); 
std::cout<<"Issuing " 
««msg.amount««std::endl; 


) 
) 
.handle«display insufficient funds»( 
[&] (display insufficient funds const& msg) 
{ 
{ 
std::lock guard«std::mutex» lk(iom); 
Std::cout««"Insufficient funds"<<std::endl; 


) 
) 
.handle«display enter Pin>! 
[&] (display enter pin const& msg) 
{ 
{ 
std::lock guard<std: :mutex> lk(iom); 
std::cout 


««"Please enter your PIN (0-9)" 
<<std::endl; 


} 
) 
.handle«display enter card»( 
[&] (display enter card const& msg) 
{ 
{ 
std::lock_guard<std: :mutex> lk(iom); 


Std::cout««"Please enter your card (I)" 
<<std::endl; 


} 
) 
.handle«display balance»( 
[&) (display balance const& msg) 


{ 


std: :lock_guard<std::mutex> 1k(iom) ; 
std::cout 
<<"The balance of your account is " 
««msg.amount««std::endl; 


} 
) 
-handle<display_withdrawal_options> { 
[&] (display withdrawal options const& msg) 
( 
{ 
std: :lock guard«std::mutex» 1k(iom) ; 
std: :cout<<"Withdraw 50? (w)"«<<std::endl; 
std: :cout<<"Display Balance? (b)" 
<<std::endl; 

std: :cout<<"Cancel? (c)"««std::endl; 


} 
) 
.handle«display withdrawal cancelled»( 
[&] (display withdrawal cancelled const& msg) 


{ 
{ 
std: :lock_guard<std::mutex> 1k(iom) ; 


std: :coute<"Withdrawal cancelled" 
<<Std::endl; 


} 
) 


-handle<display pin_incorrect_message> ( 
[&] (display_pin_incorrect_message const& msg) 


{ 
{ 
std::lock guard«std::mutex» 1k (iom); 
Std::cout««"PIN incorrect "<<std::endl; 


} 
) 
.handle«eject card»( 
[&] (eject card const& msg) 


( 
{ 
std: :lock guard«std::mutex» 1k (iom); 
std: :cout<<"Ejecting card"<<std::endl1; 


Ig 


} 


catch (messaging: :close_queue&) 


{ 
) 


messaging: :sender get sender ( ) 


{ 
} 


return incoming; 


y; 
清单 C.10 ”驱动 代码 


int main() 


{ 


bank machine bank; 
interface machine interface_hardware; 


atm machine (bank.get_sender(),interface_hardware.get_sender()); 


std::thread bank_thread(&bank_machine: :run, &bank) ; 
std::thread if thread(&interface machine: :run, &interface hardware); 
std::thread atm thread(&atm::run,&machine); 


messaging::sender atmqueue (machine.get_sender()); 
bool quit pressed-false; 


while(!quit pressed) 


{ 


char c=getchar(); 


switchíc) 

{ 

case 'O': 

case '1': 

case '2': 

case. 531. 

case '4'; 

case '5'!: 

case '6': 

case !'7': 

Case '8': 

case '9': 
atmqueue.send(digit pressedíc)); 
break; 

case 'b': 
atmqueue.send(balance pressed()); 
break; 

case 'w': 
atmqueue.send(withdraw pressed(50)); 
break; 

case 'c';: 
atmqueue.send(cancel pressed()); 
break; 

case 'q': 
quit pressed-true; 
break; 

case 'i': 


atmqueue . send {card inserted("acc1234")); 
break; 


bank.done(); 
machine.done(); 

interface hardware.done(); 
atm thread.join(); 

bank thread.join(); 

if thread.join(); 


附录 D C++ 线程 类 库 参 考 


D.1 <chrono> 头 文件 


<chrono> 头 文件 提供 了 表示 时 间 点 和 duration 的 类 ， 以 及 可 作 
为 time_point 源 的 时 钟 类 。 每 个 时 钟 都 有 一 个 is_steady 静 态 数 据 成 员 ， 能 够 指 
示 该 时 钟 是 否 为 一 个 按照 一 致 的 速率 〈 并 且 不 能 被 调整 ) 行进 的 勾 速 时 
钟 。std: : chrono: :steady_clock 类 是 唯一 一 个 确保 匀速 的 时 钟 。 


头 文 件 内 容 


namespace std 


{ 


namespace chrono 
{ 
template<typename Rep,typename Period = ratio«1»» 
class duration; 
template< 
typename Clock, 
typename Duration = typename Clock: :duration> 
class time point; 
class system_clock; 
class steady clock; 
typedef unspecified-clock-type high_resolution_clock; 


} 
D.1.1 std::chrono::duration 类 模板 


std: : chrono: :duration 类 模板 提供 了 一 个 代表 时 间 段 的 工具 。 模 板 的 参 
数 Rep 和 Period 是 用 来 存储 时 间 段 值 的 数据 类 型 ， 还 有 一 个 std: :ratio 类 模板 的 
实例 用 来 指示 与 下 一 个 时 钟 周期 之 间 的 时 间 长 度 〈 单 位 是 几 分 之 一 秒 ) 。 因 
此 std: :chrono: :duration<int，std::milli> 是 以 int 类 型 值 存储 的 毫秒 
数 ，std: :chrono: :duration<short，std::ratio<1，56>> 是 以 short 值 类 
型 存储 的 50 分 之 一 秒 的 数量 ，std: :chrono: :duration<long long, 
std: :ration<66，1>> 是 以 long long 值 类 型 存储 的 分 钟 数 。 


template <class Rep, class Period=ratio<1l> > 
class duration 
{ 
public: 
typedef Rep rep; 
typedef Period period; 


constexpr duration() = default; 


~duration() = default; 
duration(const duration&) = default; 
duration& operator=(const duration&) = default; 


template <class Rep2> 
constexpr explicit duration(const Rep2& r); 


template «class Rep2, class Period2> 
constexpr duration(const duration<Rep2, Period2>& d); 


constexpr rep count() const; 
constexpr duration operator+() const; 
constexpr duration operator-() const; 


duration& operator++ (); 

duration operator++ (int); 

duration& operator--(); 

duration operator-- (int); 

duration& operator«-(const duration& d); 
duration& operator--(const duration& d); 
duration& operator*-(const rep& rhs); 
duration& operator/-(const rep& rhs); 
duration& operator%=(const rep& rhs); 
duration& operator%=(const duration& rhs); 
static constexpr duration zero(); 

Static constexpr duration min(); 

static constexpr duration max(); 


}; 


template <class Repl, class Periodl, class Rep2, class Period2> 
constexpr bool operator== ( 

const duration«Repl, Periodl>& lhs, 

const duration<Rep2, Period2>& rhs); 


template «class Repl, class Periodl, class Rep2, class Period2> 
constexpr bool operator!-( 

const duration<Repl, Periodl»& lhs, 

const duration<Rep2, Period2»& rhs); 


template <class Repl, class Periodl, class Rep2, class Period2> 
constexpr bool operator«( 


const duration<Repl, Periodl»& lhs, 
const duration<Rep2, Period2>& rhs); 


template <class Repl, class Periodl, class Rep2, class Period2» 
constexpr bool operator«-( 

const duration«Repl, Periodl»& lhs, 

const duration«Rep2, Period2>& rhs); 


template «class Repl, class Periodl, class Rep2, class Period2> 
constexpr bool operator> ( 

const duration<Repl, Periodl»& lhs, 

const duration<Rep2, Period2>& rhs); 


template <class Repl, class Periodl, class Rep2, class Period2> 
constexpr bool operator >=({ 

const duration<Repl, Periodl»& lhs, 

const duration<Rep2, Period2>& rhs); 


template <class ToDuration, class Rep, class Period> 
constexpr ToDuration duration cast (const duration<Rep, Period>& d); 


Rep 必 须 是 内 置 的 数值 类 型 ， 或 者 是 类 似 数 字 的 用 户 定 义 类 型 。Period 必 须 
是 std: :ratio<> 的 一 个 实例 。 


std::chrono::duration::rep typedef 

该 typedef 定 义 的 类 型 用 于 保存 duration 值 中 的 刻度 数目 。 

声明 
typedef Rep rep; 

rep 是 一 个 用 来 存放 duration 对 象 的 内 部 表示 值 的 类 型 。 
std::chrono::duration::period typedef 

该 typedef 定 义 了 一 个 std: :ratio 类 模板 实例 ， 该 实例 规定 了 时 间 段 的 计数 
值 的 单位 是 多 少 分 之 一 秒 。 例 如 ， 如 果 peroid 是 std: :ratio<1，56>， 和 那么 一 
count () 为 N 的 时 间 段 值 表示 50 分 之 N 秒 。 

声明 


typedef Period period; 


std::chrono::duration 默 认 构 造 函数 
用 默认 值 构造 std: : chrono: :duration 实 例 。 
声明 
constexpr duration() = default; 
结果 
duration (类 型 为 rep) 的 内 部 值 被 默认 初始 化 。 
std::chrono::duration 来 自 计 数值 的 转换 构造 函数 
用 指定 的 计数 值 构造 一 个 std: : chrono: :duration 实 例 。 
声明 


template <class Rep2> 
constexpr explicit duration(const Rep2& r); 


结果 
duration 对 象 的 内 部 值 被 初始 化 为 static_cast<rep>(r)。 
需求 


只 有 当 Rep2 可 以 隐 式 转换 为 Rep， 并 且 Rep 是 浮 点 类 型 或 者 Rep2 不 是 浮 点 类 
型 的 时 候 ， 此 构造 函数 才 会 参与 到 重 载 方案 中 。 


JH ELTE 
this->count ()==static_cast<rep>(r) 


std::chrono::duration 来 自 另 一 个 STD::CHRONO::DURATION 值 的 转换 构造 函 
数 
通过 比例 缩放 另 一 个 std: : chrono: :duration 对 象 的 计数 值 ， 构 
造 std: :chrono: :duration 实 例 。 
声明 
template <class Rep2, class Period2> 
constexpr duration(const duration<Rep2, Period2>& d); 


结果 


用 duration_cast<duration<Rep，Period>>(d) .count() 来 初始 
化 duration 对 象 的 内 部 值 。 


只 有 当 Rep 是 浮 点 类 型 ， 或 者 Rep2 不 是 一 个 浮 点 类 型 并 且 Period2 是 Peroid 
的 整数 倍 时 ( 即 ratio_divide<Period2，Period>: :den ==1) ， 此 构造 函数 
才 会 参与 到 重 载 方案 中 。 这 样 可 以 在 将 一 个 较 短 的 时 间 存 储 到 代表 较 长 时 间 间 隔 
的 变量 时 ， 避 免 意料 之 外 的 截断 《同时 导致 精度 的 损失 ) 。 

后 置 条 件 


this-»count()--duration cast«duration«Rep,Period»»(d).count() 


示例 
à | se) TRES 人 > 
duration«int,ratio«1,1000»» ms(5}; sl 5 毫秒 错误 : 不 能 将 ms 存储 为 
duration<int, ratio<1,1>> sí(ms); qt 整数 秒 
duration«double,ratio«1,1»» s2(ms); <+— JEM, p2.count==0.005 
duration<int, ratio<1,1000000>> us (ms); +H) FEM, us.count—5000 


std::chrono::count 成 员 函 数 
获取 时 间 段 值 。 
声明 
constexpr rep count(} const; 
返回 
duration 对 象 的 内 部 值 ， 以 rep 类 型 表示 。 
std::chrono::duration::operator+ 一 元 加 号 运算 符 
这 其 实 没 有 运算 : 仅 返 回 *this 的 副本 。 
声明 
constexpr duration operator+{) const; 
返回 
*this 


std::chrono::duration::operator- 一 元 减 写 运算 符 
返回 一 个 时 间 段 值 ， 其 count() 值 是 this->count() 的 负 值 。 
声明 

constexpr duration operator-() const; 
返回 

duration(-this-»count()); 

std::chrono::duration:operator++ 前 置 自 增 运 算 符 
增加 内 部 计数 。 
声明 

duration& operator++({); 
结果 

++this->internal count, 
返回 

*this 

std::chrono::duration::operator++ 后 置 自 增 运 算 符 
增加 内 部 计数 ， 并 且 返 回 增加 前 的 *this 值 。 
声明 

duration operator++(int).,; 
结果 


duration temp (*this) ; 
++ (*this) ; 
return temp; 


std::chrono::duration::operator-- 前 置 自 减 运算 符 


减 小 内 部 计数 。 


声明 

duration& operator--(); 
结果 

--this->internal count; 
返回 

*this 


std::chrono::duration::operator-- 后 置 自 减 运算 符 


减 小 内 部 计数 ， 并 且 返 回 减 小 前 的 *this 值 。 


声明 

duration operator-- (int) ; 
结果 

duration tempí*this); 

--(*this); 


return temp; 


std::chrono::duration::operator+= 复 合 赋值 运算 符 
将 另 一 个 duration 对 象 的 计数 值 加 到 *this 的 内 部 计数 值 上 。 
声明 

duration& operator-«-(duration const& other); 
zh 

internal count:s-other.count(); 
返回 

*this 


std::chrono::duration::operator-= 复 合 赋值 运算 符 


从 *this 内 部 的 计数 值 减 去 另 一 个 duration 对 象 的 计数 值 。 


声明 

duration& operator--(duration const& other); 
结果 

internal count-=other. count () ; 
返回 

*this 


std::chrono::duration::operator*= 复 合 赋值 运算 符 
将 *this 内 部 计数 值 乘 以 给 定 的 数值 。 
声明 
duration& operator*-(rep const& rhs) ; 
Zh 
internal count*-rhs; 
返回 
*this 


std::chrono::duration::operator/= 复 合 赋值 运算 符 
将 *this 的 内 部 计数 值 除 以 给 定 的 数值 。 
声明 
duration& operator/=(rep const& rhs); 
结果 
internal count/-rhs; 
返回 
*this 


std::chrono::duration::operator%= 复 合 赋值 运算 符 


将 *this 内 部 计数 值 设 为 其 与 给 定数 值 相 除 的 余数 。 


声明 
duration& operator%=(rep const& rhs) ; 
结果 
internal count%=rhs; 
返回 值 
«this 


std::chrono::duration::operator 96-7 £ A WU $E TT 
将 *this 内 部 计数 值 设 为 其 与 男 一 duration 对 象 计数 值 相 除 的 余数 。 
声明 
duration& operator%= (duration const& rhs}; 
结 
internal count%=rhs.count () ; 
返回 值 
*this 
std::chrono::duration::zero 静 态 成 员 函 数 
返回 一 个 表示 零 值 的 duration 对 象 。 
声明 
constexpr duration zero(); 
返回 值 


duration (duration values«rep»::zero()); 


std::chrono::duration::min 静 态 成 员 函 数 
返回 一 个 duration 对 象 ， 该 对 象 保存 着 给 定 实 例 最 小 的 可 能 值 。 
声明 


constexpr duration min(); 


返回 值 
duration(duration values«rep»::min()); 
std::chrono::duration: maxi 5 Jj, 53 PK 2 
返回 一 个 duration 对 象 ， 该 对 象 保存 着 给 定 实例 最 大 的 可 能 值 。 
声明 
constexpr duration max(); 
返回 值 


duration {duration values«rep»::maxí)); 


MY 


std::chrono::duration 相 等 比较 运算 符 
比较 两 个 duration 对 象 是 否 相 等 ， 即 便 它们 具有 不 同 的 表现 形式 和 周期 。 
声明 


template <class Repl, class Periodl, class Rep2, class Period2> 
constexpr bool operator== ( 

const duration<Repl, Periodl»& lhs, 

const duration«Rep2, Period2»& rhs); 


需求 

每 个 1hs 必 须 可 以 隐 式 地 转换 到 rhs， 反 之 亦 然 。 如 果 它 们 不 能 彼此 进行 隐 式 
转换 ， 或 者 它们 是 不 同 的 duration 实 例 化 结果 但 能 够 相互 隐 式 转换 ， 该 表达 式 都 
是 不 规范 的 。 


结果 


如 果 CommonDuration 是 std: :common_type<duration<Rep1, Period1>, 
duration<Rep2，Period2>>: :type 的 同义词 ， 那 么 lhs==rhs 返 回 
CommonDuration(lhs).count()==CommonDuration(rhs).count() 的 结 


std::chrono::duration 不 等 比较 运算 符 


比较 两 个 duration 对 象 是 否 不 相等 ， 即 便 它 们 具有 不 同 的 表现 形式 和 /或 周 


template <class Repl, class Periodl, class Rep2, class Period2> 
constexpr bool operator! = ( 

const duration<Repl, Periodl»& lhs, 

const duration«Rep2, Period2>& rhs); 


每 个 lhs 必 须 可 以 隐 式 地 转换 到 rhs， 反 之 亦 然 。 如 果 它 们 不 能 彼此 进行 隐 式 
转换 ， 或 者 它们 是 不 同 的 duration 实 例 化 结果 但 能 够 相互 隐 式 转换 ， 该 表达 式 都 
是 不 规范 的 。 

返回 
! (1hs--rhs) 


std::chrono::duration 小 于 比较 运算 符 


比较 两 个 duration 对 象 ， 看 其 中 一 个 是 否 小 于 男 一 个 ， 即 便 它们 具有 不 同 的 
表现 形式 和 /或 周期 。 


声明 


template <class Repl, class Periodl, class Rep2, class Period2> 
constexpr bool operator«( 

const duration<Repl1, Period1»& lhs, 

const duration«Rep2, Period2>& rhs); 
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转换 ， 或 者 它们 是 不 同 的 duration 实 例 化 结果 但 能 够 相互 隐 式 转换 ， 该 表达 式 都 
是 不 规范 的 。 


结果 


如 果 CommonDuration 是 std: :common type<duration<Rep1，Period1>， 
duration<Rep2，Period2>>: :type 的 同义词 ， 那 么 lhs<rhs 返 回 
CommonDuration(lhs).count()<CommonDuration(rhs).count() 的 结果 。 


std::chrono::duration 大 于 比较 运算 符 


比较 两 个 duration 对 象 ， 看 其 中 一 个 是 否 大 于 男 一 个 ， 即 便 它们 具有 不 同 的 
表现 形式 和 /或 周期 。 


声明 


template <class Repl, class Periodl, class Rep2, class Period2> 
constexpr bool operator»(í 

const duration«Rep1, Periodl>& lhs, 

const duration«Rep2, Period2»& rhs); 


需求 

每 个 lhs 必 须 可 以 隐 式 地 转换 到 rhs， 反 之 亦 然 。 如 果 它 们 不 能 彼此 进行 隐 式 
转换 ， 或 者 它们 是 不 同 的 duration 实 例 化 结果 但 能 够 相互 隐 式 转换 ， 该 表达 式 都 
是 不 规范 的 。 

返回 
rhs<lhs 
std::chrono::duration 小 于 或 等 于 比较 运算 符 


比较 两 个 duration 对 象 ， 看 其 中 一 个 是 否 小 于 或 者 等 于 另 一 个 ， 即 便 它们 具 
有 不 同 的 表现 形式 和 /或 周期 。 
声明 


template <class Repl, class Periodl, class Rep2, class Period2> 
constexpr bool operator«s( 

const duration<Repl1, Periodl>& lhs, 

const duration«Rep2, Period2>& rhs); 


每 个 hs 必须 可 以 隐 式 地 转换 到 rhs， 反 之 亦 然 。 如 果 和 它们 不 能 彼此 进行 隐 式 
转换 ， 或 者 它们 是 不 同 的 duration 实 例 化 结果 但 能 够 相互 隐 式 转换 ， 该 表达 式 都 
是 不 规范 的 。 

返回 
! (rhs«lhs) 


std::chrono::duration 大 于 或 等 于 比较 运算 符 


比较 两 个 duration 对 象 ， 看 其 中 一 个 是 否 大 于 或 者 等 于 男 一 个 ， 即 便 它们 具 
有 不 同 的 表现 形式 和 周期 。 


声明 


template <class Repl, class Periodl, class Rep2, class Period2> 
constexpr bool operator>= ( 

const duration<Repl, Periodl»& lhs, 

const duration«Rep2, Period2»& rhs); 


每 个 lhs 必 须 可 以 隐 式 地 转换 到 rhs， 反 之 亦 然 。 如 果 它 们 不 能 彼此 进行 隐 式 
转换 ， 或 者 它们 是 不 同 的 duration 实 例 化 结果 但 能 够 相互 隐 式 转换 ， 该 表达 式 都 
是 不 规范 的 。 

返回 
! (1hs«rhs) 


std::chrono::duration cast4E X 5i PA Zi 


显 式 地 将 一 个 std: :chrono: :duration 对 象 转 换 为 指定 的 
std: :chrono: :duration 实 例 。 


声明 


template <class ToDuration, class Rep, class Period> 
constexpr ToDuration duration cast (const duration<Rep, Period»& d); 


ToDuration 必 须 是 std: :chrono: :duration 的 实例 。 
返回 


时 间 段 d 被 转换 为 ToDuration 所 指定 的 时 间 段 类 型 。 这 种 方法 能 够 尽量 减少 
不 同 尺度 和 表示 类 型 之 间 的 转换 所 造成 的 精度 损失 。 


D.1.2 std::chrono::time_point 类 模板 


std: :chrono: :time_point 类 模板 表示 一 个 以 特定 时 钟 来 计量 的 时 间 点 。 
它 被 指定 为 特定 时 钟 所 经 过 的 一 段 纪 元 (epoch) 。 模 板 参 数 Clock 指 定 了 这 一 时 
钟 〈 每 个 不 同 的 时 钟 必须 有 具备 单独 的 类 型 ) ， 同 时 Duration 模 板 参 数 是 用 来 计量 
经 过 时 间 的 类 型 ， 且 必须 是 std: :chrono: :duration 类 模板 的 实例 。Duration 
默认 情况 下 是 Clock 的 默认 时 间 段 类 型 。 


template «class Clock,class Duration = typename Clock: :duration> 
class time_point 


{ 
public: 
typedef Clock clock; 
typedef Duration duration; 
typedef typename duration::rep rep; 
typedef typename duration: :period period; 


time point (); 
explicit time point(const duration& d); 


template «class Duration2> 
time point {const time point«clock, Duration2>& t); 


duration time since epoch() const; 


time point& operator+=(const duration& d); 
time point& operator--(const duration& d); 


static constexpr time point min(); 
static constexpr time point max(); 


): 
std::chrono::time point? iÀ 44) 14 PR AY 


构造 一 个 time_point， 表 示 相 关联 的 Clock 的 间隔 ; 其 内 部 的 时 间 段 被 初始 
化 为 Duration: :zero()。 


声明 
time point (); 
后 置 条 件 


对 于 新 的 默认 构造 time_point 对 象 tp，tp.time_since_epoch() == 
tp::duration::zero(). 


std::chrono::time pointli'] [5] Ez $438: PR BL 
构造 time_point， 表 示 其 相关 联 的 Clock 的 间隔 为 指定 的 时 间 段 。 
声明 


explicit time point (const duration& d); 


后 置 条 件 
对 于 time_point 对 象 tp， 以 表示 时 间 段 d 的 tp(d) 进 行 构 


i$, tp.time since epoch() == d. 
std::chrono::time point 14 14) i PR AY 


从 另 一 个 具有 相同 Clock 但 不 同 的 Duration 的 time_point 对 象 ， 来 构造 一 
个 time_point 对 象 。 


声明 


template <class Duration2> 
time point (const time point«clock, Duration2>& t); 


Duration2 必 须 能 够 隐 式 地 转换 为 Duration。 
结 


例如 time_point(t.time_since epoch()). t.time_since_epoch() fy 
返回 值 被 隐 式 转换 为 Duration 类 型 的 对 象 ， 且 该 值 被 存储 在 新 构造 的 
time point 对 象 中 。 
std::chrono::time_point::time_since_epoch 成 员 函 数 
获取 特定 time_point 对 象 的 时 钟 间 隔 时 间 段 。 
声明 
duration time since epoch() const; 
返回 
*this 中 存储 的 duration 值 。 


std::chrono::time_point::operator+= 复 合 赋值 运算 符 
将 指定 的 duration 加 到 指定 的 time_point 对 象 所 存储 的 值 上 。 
声明 


time point& operator+=(const duration& d); 


结果 

将 d 加 到 *this 内 部 的 duration 对 象 上 ， 例 如 : 
this-»internal duration += d; 

返回 
*this 


std::chrono::time_point::operator-= 复 合 赋值 运算 符 
将 指定 的 time_point 对 象 中 存储 的 值 中 减 去 指定 的 duration。 
声明 
time point& operator-=(const duration& d); 
结果 
从 *this 内 部 的 duration 对 象 减 去 d， 例 如 : 
this-»internal duration -= d; 
返回 
*this 
std::chrono::time_point::min 静 态 成 员 函 数 
得 到 一 个 代表 其 类 型 的 最 小 可 能 值 的 time_point 对 象 。 
声明 
static constexpr time point min(); 


返回 


time_point(time_point: : duration: :min()) 


td::chrono::time_point::maxii# As X, eR BL 
得 到 一 个 代表 其 类 型 的 最 大 可 能 值 的 time_point 对 象 。 


声明 


static constexpr time point max(); 


返回 


time_point(time_point: : duration: :max()) 


D.1.3 std::chrono::system_clock2& 


std: :chrono: :system_clock 类 提供 了 从 系统 真实 时 间 获 取 当 前 挂钟 时 间 
的 方法 。 当 前 时 间 可 以 通过 调用 std: :chrono: :system_clock: :now() 来 获 
得 。std: :chrono: :system_clock: :time_point 的 实例 可 以 通过 
std::chrono::system clock::to time t() 和 
std::chrono::system clock::to time _point() 函 数 ， 而 与 time_ t4H H4 
换 。 系 统 时 钟 不 是 匀速 的 ， 所 以 之 后 对 std: :chrono: :system_clock: :now() 
的 调用 ， 可 能 会 返回 比 之 前 的 调用 更 早 的 时 间 〈 比 如 ， 操 作 系 统 的 时 钟 被 手动 调 
整 过 或 是 与 外 部 时 钟 进行 了 同步 ) 。 


类 定义 


class system_clock 


{ 

public: 
typedef unspecified-integral-type rep; 
typedef std: :ratio<unspecified, unspecified> period; 
typedef std::chrono::duration«rep,period» duration; 


typedef std::chrono::time point«system clock» time point; 
static const bool is steadyzunspecified; 


static time point now() noexcept; 


static time t to time t(const time point& t) noexcept; 
static time point from time tt 人 time t t) noexcept; 


y: 

std::chrono::system_clock::rep typedef 
某 个 整数 类 型 的 类 型 别名 ， 用 来 存储 duration 值 中 的 刻度 数量 。 
声明 


typedef unspecified-integral-type rep; 


std::chrono::system clock::periodtypedef 


某 std: : ratio 类 模板 实例 的 类 型 别名 ， 用 来 指定 在 两 个 duration 
或 time_point 间 最 小 的 秒 数 〈 或 几 分 之 一 秒 ) 。period 指 定 了 时 钟 的 精度 ， 而 
非 其 步 进 频率 。 

声明 
typedef std::ratio<unspecified, unspecified> period; 


std::chrono::system clock::durationtypedef 


std: :chrono: :duration 类 模板 的 实例 ， 它 能 够 保存 由 系统 范围 实时 时 钟 
所 返回 的 任意 两 个 时 间 点 的 差 值 。 


声明 
typedef std::chrono::duration« 


stds schrono: :system clocks: rep, 
std::chrono::system clock: :period> duration; 


std::chrono::system_clock::time_pointtypedef 


std: :chrono: :time_point 类 模板 的 实例 ， 它 能 够 保存 由 系统 范围 实时 时 
钟 返回 的 时 间 点 。 


声明 
typedef std::chrono::time point«std::chrono::system clock» time point; 
std::chrono::system clock::nowif AK 53 PR AL 

从 系统 范围 实时 时 钟 获取 当前 的 挂钟 时 间 。 

声明 


time point now() noexcept; 


返回 
代表 当前 系统 范围 实时 时 钟 的 当前 时 间 的 time_point。 
引发 


如 果 发 生 错 误 ， 引 发 std: :system_error 类 型 的 异常 。 


std::chrono::system clock::to time t$ 2S IK 73 P BL 


将 time_point 实 例 转换 到 time t. 
声明 

time t to time t(time point const& t) noexcept; 
返回 
表示 与 t 相 同时 间 点 的 time_t 值 ，t 会 被 进位 或 截取 至 秒 的 精度 。 
引发 


如 果 发 生 错 误 ， 引 发 std: :system_error 类 型 的 异常 。 


std::chrono::system_clock::from_time_t 静 态 成 员 函 数 
将 time_t 实 例 转 换 到 time_point。 
声明 
time point from time t(time t const& t) noexcept; 
返回 
代表 与 t 相 同时 间 点 的 time_point 值 。 
引发 


如 果 发 生 错 误 ， 引 发 std: :system_error 类 型 的 异常 。 


D.1.4 std::chrono::steady_clock 类 


std: : chrono: :steady_clock 类 提供 了 对 系统 范围 匀速 时 钟 的 访问 。 当 前 
时 间 可 以 通过 调用 std: : chrono: : steady. clock: :now() 来 获取 。 
在 std: :chrono::steady_clock: :now() 和 挂钟 时 间 之 间 并 没有 固定 的 关系 。 
匀速 的 时 钟 不 能 往 回 走 ， 所 以 如 果 一 个 对 
std: :chrono: :steady_clock: :now() 的 调用 在 另 一 个 对 它 的 调用 之 前 ， 那 么 
第 二 个 调用 必须 返回 与 第 一 个 相同 或 比 它 更 晚 的 时 间 点 。 此 时 钟 以 统一 的 速率 ， 
尽 可 能 久 地 前 进 。 


class steady_clock 


{ 
public: 
typedef unspecified-integral-type rep; 
typedef std: :ratio< 
unspecified, unspecified» period; 
typedef std::chrono::duration«rep,period» duration; 
typedef std::chrono::time point«steady clock- 
time point; 
static const bool is steady-true; 
static time point now() noexcept; 
Fs 


std::chrono::steady_clock::rep typedef 
某 个 整数 类 型 的 类 型 别名 ， 用 来 存储 duration 值 中 的 刻度 数量 。 
声明 


typedef unspecified-integral-type rep; 


std::chrono::steady_clock::period typedef 


某 std: : ratio 类 模板 实例 的 类 型 别名 ， 用 来 指定 在 两 个 duration 
或 time_point 间 最 小 的 秒 数 〈 或 几 分 之 一 秒 ) 。period 指 定 了 时 钟 的 精度 ， 而 
非 其 步 进 频率 。 

声明 


typedef std::ratio<unspecified, unspecified> period; 


std::chrono::steady_clock::duration typedef 


std: :chrono: :duration 类 模板 的 实例 ， 它 能 够 保存 由 系统 范围 匀速 的 时 
钟 所 返回 的 任意 两 个 时 间 点 的 差 值 。 
声明 


typedef std::chrono::duration« 
std: :chrono: :steady clocks: rep, 
std: :chrono: :steady clock: :period> duration; 


std::chrono::steady_clock::time_pointtypedef 


std: :chrono: :time_point 类 模板 的 实例 ， 它 能 够 保存 由 系统 范围 匀速 的 
时 钟 返回 的 时 间 点 。 
声明 


typedef std::chrono::time point«std::chrono::steady clock» time point; 
std::chrono::steady_clock::now#t Z I bà RAI BL 
从 系统 范围 勺 速 的 时 钟 获 取 当 前 的 时 间 。 


声明 
time point now() noexcept; 

返回 

代表 当前 系统 范围 匀速 时 钟 的 当前 时 间 的 time_point。 

引发 

如 果 发 生 错 误 ， 引 发 std: :system_error 类 型 的 异常 。 

同步 


如 果 一 个 对 std: ;chrono: :steady_clock: :now() 的 调用 发 生 在 另 一 个 之 
前 ， 那 么 第 一 个 调用 所 返回 的 time_point 必 须 小 于 或 等 于 第 二 个 调用 所 返回 的 
值 。 


D.1.5 std::chrono::high resolution clock typedef 


std::chrono::high resolution clock 类 以 高 精度 提供 了 对 系统 范围 时 
钟 的 访问 。 对 于 所 有 的 时 钟 ， 当 前 时 间 可 以 通过 调 
用 std: :chrono: :high_resolution_clock: :now() 来 获 
HY. std::chrono::high resolution clock 可 以 
是 std: :chrono: :system_clock 类 或 者 是 std: :chrono: :steady_clock 类 的 


typedef， 或 者 它 可 以 是 单独 的 类 型 。 


尽管 std: :chrono: :high resolution clock 具有 所 有 库 中 提供 的 时 钟 的 
最 高 精度 ，std: :chrono: :high_resolution clock: :now() 仍 然 会 占用 一 定 
的 时 间 量 。 在 对 短 操作 进行 计时 的 时 候 你 必须 小 心 的 评估 对 
std::chrono::high resolution clock: :now() 调 用 的 开销 。 


class high resolution clock 
{ 
public: 
typedef unspecified-integral-type rep; 
typedef std::ratio< 
unspecified, unspecified> period; 
typedef std::chrono::duration«rep,period» duration; 


typedef std::chrono::time point« 
Unspeoifieds time point; 
static const bool is steady-unspecified; 


static time point now() noexcept; 


D.2 «condition variable> 头 文件 


<condition_variable> 头 文件 提供 了 条 件 变量 。 这 些 都 是 基本 级 别 的 同步 
机 制 ， 可 以 允许 一 个 线程 阻塞 直到 某 些 条 件 为 真 或 者 经 过 了 超时 期 限 。 


头 文 件 内 容 


namespace std 


{ 


enum class cv status { timeout, no timeout }; 


class condition variable; 
class condition variable any; 


} 


D.2.1 std::condition, variables 
std::condition _ variable 类 人 允许 线程 等 待 一 个 条 件 变 为 true。 
std::condition _ variable 的 实例 ， 不 

xECopyAssignable. CopyConstructible. MoveAssignablejl 

MoveConstructible 的 。 


类 定义 


class condition variable 
public: 
condition variable(); 
^condition variable(); 


condition variable(condition variable const& ) = delete; 
condition variable& operator-(condition variable const& ) = delete; 


void notify one() noexcept; 
void notify all() noexcept; 


void wait (std: :unique lock«std::mutex»& lock); 


template «typename Predicate> 
void wait (std: :unique lock«std::mutex»& lock, Predicate pred); 


template «typename Clock, typename Duration» 
cv status wait until( 
Std::unique lock«std::mutex»& lock, 
const std::chrono::time point«Clock, Duration>& absolute time); 


template «typename Clock, typename Duration, typename Predicate> 
bool wait_until ( 
std::unique lock<std: :mutex>& lock, 
const std::chrono::time point«Clock, Duration»& absolute time, 
Predicate pred); 


template «typename Rep, typename Period> 
cv status wait for(í 
std::unique lock«std::mutex»& lock, 
const std::chrono::duration«Rep, Period>& relative time); 


template «typename Rep, typename Period, typename Predicate> 
bool wait for( 
Std::unique lock«std::mutex»& lock, 
const std::chrono::duration«Rep, Period»& relative time, 
Predicate pred); 


ys 


void notify all at thread exit (condition variable&,unique lock«mutex»); 
std::condition_variable 默 认 构造 函数 

构造 std: :condition _ variable 对 象 。 

声明 


condition variable(); 


结果 

构造 一 个 新 的 std: :condition_variable 实 例 。 

引发 

如 果 条 件 变量 无 法 构造 ， 抛 出 std: :system_error 类 型 的 异常 。 
std::condition_variable 析 构 函 数 

销毁 std: :condition _ variable 对 象 。 

声明 
~condition variable () ; 

前 置 条 件 


在 对 wait()、wait_ for() 和 wait_until() 的 调用 中 ， 没 有 线程 被 阻塞 
在 *this 上 。 


结 
销毁 *this。 
引发 
无 。 
std::condition_variable::notify_one 成 员 函 数 
唤醒 当前 在 std: :condition_variable 上 等 待 的 其 中 一 条 线程 。 
声明 
void notify one() noexcept; 
结果 


在 调用 处 ， 唤 醒 在 *this 上 等 待 的 其 中 一 条 线程 。 如 果 没 有 线程 等 待 着 ， 此 
调用 没有 任何 效果 。 


引发 


如 果 无 法 得 到 结果 ， 引 发 std: :system_error 异 常 。 


同步 


在 单一 std: :condition variable 实 例 上 对 
notify one(). notify al1()、wait()、wait_for() 和 wait_until() 的 调 
用 会 被 序列 化 。 对 notify_one() 或 notify_all1() 的 调用 ， 只 会 唤醒 在 该 调用 之 
前 就 开始 等 待 的 线程 。 


std::condition_variable::notify_all 成 员 函 数 


唤醒 当前 在 std: :condition variable 上 等 待 的 全 部 线程 。 
声明 

void notify all() noexcept; 
结 


在 调用 处 ， 唤 醒 在 *this 上 等 竺 的 所 有 线程 。 如 果 没 有 线程 等 待 着 ， 此 调用 
没有 任何 效果 。 


引发 
如 果 无 法 得 到 结果 ， 引 发 std: :system_error 异 常 。 
同步 


在 单一 std: :condition_ variable 实 例 上 对 
notify one(). notify all()、wait()、wait_for() 和 wait_until() 的 调 
用 会 被 序列 化 。 对 notify_one() 或 notify_all1() 的 调用 ， 只 会 唤醒 在 该 调用 之 
前 就 开始 等 待 的 线程 。 


std::condition_variable::wait 成 员 函 数 


直 等 待 ， 直 到 std: :condition variable 通 过 调 


用 notify_ one(). notify al1() 或 伪 唤 醒 而 被 唤醒 。 
声明 
void wait (std: :unique lock<std: :mutex>& lock); 
前 置 条 件 
lock.owns_lock() 为 真 ， 且 该 锁 为 调用 线程 所 拥有 。 
结果 


原子 级 解锁 所 提供 的 lock 对 象 并 阻塞 ， 直 到 该 线程 被 另 一 个 线程 通过 调 
用 notify_one()、notify_al1() 而 唤醒 ， 或 是 线程 自己 伪 唤 醒 。 在 对 wait() 
的 调用 返回 之 前 ，lock 对 象 被 再 次 锁定 。 


引发 


如 果 无 法 得 到 结果 ， 引 发 std: :system_error 异 常 。 如 果 lock 对 象 在 调 
用 wait( ) 之 中 被 解锁 ， 它 会 在 退出 时 再 次 被 锁定 ， 即 便 函 数 经 由 异常 而 退出 。 


注 ” 伪 唤醒 的 意思 是 调用 wait( ) 的 线程 可 能 在 没有 线程 调用 过 
notify_one() 或 notify_all() 的 情况 下 唤醒 。 因 此 建议 如 果 可 能 
的 话 ， 首 选 接受 断言 的 wait( ) 重 载 版 本 。 否 则 ， 建 议 在 一 个 测试 与 
条 件 变量 关联 的 断言 的 循环 中 来 调用 wait()。 


同步 


在 单一 std: :condition_variable 实 例 上 对 
notify one(). notify all()、wait()、wait_for() 和 wait_until() 的 调 
用 会 被 序列 化 。 对 notify_one() 或 notify_all() 的 调用 ， 只 会 唤醒 在 该 调用 之 
前 就 开始 等 待 的 线程 。 


std::condition_variable::wait 成 员 函 数 之 接受 断言 的 重 载 版 本 


直 等 待 ， 直 到 std: :condition variable 通过 调 
用 notify_ one(). notify al1() 而 被 唤醒 ， 且 断言 为 true。 


声明 


template<typename Predicate> 
void wait (std: :unique_ lock«std::mutex»& lock, Predicate pred); 


前 置 条 件 


表达 式 pred( ) 必 须 有 效 ， 且 其 返回 的 可 转换 为 boo1.1lock.owns_lock() 的 
值 必须 为 true， 且 该 锁 必 须 被 调用 wait( ) 的 线程 所 拥有 。 


结果 


类 似 于 
while (!pred())} 


{ 
| 


wait (lock); 


引发 
因 调 用 pred 所 引发 的 所 有 异常 ， 或 者 如 果 无 法 得 到 结果 ， 引 发 


std::system error. 


注 ” 潜 在 的 伪 唤 醒 的 意思 是 无 法 确定 pred 会 被 调用 多 少 
次 。pred 总 是 被 1ock 锁 定 的 互 斥 元 调用 ， 而 且 当 《〈 且 仅 
当 ) (bool)pred() 返 回 true 时 该 函数 才 会 返回 。 


同步 


在 单一 std: :condition _ variable 实例 上 对 
notify one(). notify all()、wait()、wait_for() 和 wait_until() 的 调 
用 会 被 序列 化 。 对 notify_one() 或 notify_all() 的 调用 ， 只 会 唤醒 在 该 调用 之 
前 就 开始 等 待 的 线程 。 


std::condition variable::wait for 成 员 函 数 


直 等 待 ， 直 到 std: :condition variable 通 过 调 
用 notify_one()、notify_al1() 或 伪 唤 醒 而 被 唤醒 ， 或 者 直到 一 个 指定 的 时 间 
段 逝去 或 线程 被 伪 唤 醒 。 


声明 


template<typename Rep, typename Period> 
cv Status wait for( 
std::unique lock«std::mutex»& lock, 
std: :chrono: :duration<Rep, Period> const& relative time) ; 


前 置 条 件 


lock.owns_lock() 为 真 ， 且 该 锁 为 调用 线程 所 拥有 。 

结果 

原子 级 解锁 所 提供 的 lock 对 象 并 阻塞 ， 直 到 该 线程 被 另 一 个 线程 通过 调 
用 notify_one()、notify_al1() 而 唤醒 ， 或 者 relative_time 指 定 的 时 间 段 逝 
去 ， 或 是 线程 自己 伪 唤 醒 。 在 对 wait_for( ) 的 调用 返回 之 前 ，lock 对 象 被 再 次 
锁定 。 

引发 


如 果 无 法 得 到 结果 ， 引 发 std: :system_error 异 常 。 如 果 lock 对 象 在 调 
用 wait() 之 中 被 解锁 ， 它 会 在 退出 时 再 次 被 锁定 ， 即 便 函 数 经 由 异常 而 退出 。 


注 ” 伪 唤醒 的 意思 是 调用 wait_for( ) 的 线程 可 能 在 没有 线程 调 
用 过 notify_one() 或 notify_all() 的 情况 下 唤醒 。 因 此 建议 如 果 
可 能 的 话 ， 首 选 接受 断言 的 wait_for( ) 重 载 版 本 。 否 则 ， 建 议 在 一 
个 测试 与 条 件 变 量 关 联 的 断言 的 循环 中 来 调用 wait_for()。 当 做 此 
工作 来 确保 超时 仍然 有 效 的 时 候 必须 注意 ，wait_until() 在 多 数 场 
合 下 可 能 会 更 合适 。 线 程 可 能 会 比 指定 的 时 间 段 阻塞 更 久 。 如 果 可 
能 ， 逝 去 的 时 间 应 决定 于 匀速 时 钟 。 


同步 


在 单一 std: :condition_variable 实 例 上 对 
notify one(). notify all()、wait()、wait_for() 和 wait_until() 的 调 
用 会 被 序列 化 。 对 notify_one() 或 notify_all1() 的 调用 ， 只 会 唤醒 在 该 调用 之 
前 就 开始 等 待 的 线程 。 


std::condition variable::wait _ for 成员 函 数 之 接受 断言 的 重 载 版 本 


直 等 待 ， 直 到 std: :condition variable 通 过 调 
Hinotify one(). notify all()H.Brz7jtrue. sk ESI—^ 8E BIET IRI EO 
去 。 


声明 


template<typename Rep,typename Period,typename Predicate> 
bool wait_for( 
std::unique lock«std::mutex»& lock, 
std: :chrono: :duration<Rep, Period> const& relative time, 
Predicate pred); 


前 置 条 件 


表达 式 pred( ) 必 须 有 效 ， 且 其 返回 的 可 转换 为 boo01.1lock.owns_lock() 的 
值 必须 为 true， 且 该 锁 必须 被 调用 wait_for( ) 的 线程 所 拥有 。 


结果 
类 似 于 


internal clock::time point end-internal clock: :now()+relative time; 
while (!pred()) 


{ 
std: :chrono: :duration<Rep, Period> remaining time= 
end-internal clock: :now(}; 
if (wait_for (lock, remaining time})==std::cv_status: :timeout) 
return pred(); 


} 


return true; 
返回 


c Ue 则 返回 true， 如 果 由 relative_time 
指定 的 时 间 间 隔 逝 去 且 pred() 返 回 false， 则 返回 false。 


TE 潜在 的 伪 唤 醒 的 意思 是 无 法 确定 pred 会 被 调用 多 少 
次 。pred 总 是 被 1ock 锁 定 的 互 斥 元 调用 ， 而 且 当 《〈 且 仅 
当 ) (bool)pred() 返 回 true 或 者 relative _ time 指定 的 时 间 段 逝去 
时 该 函数 才 会 返回 。 线 程 可 能 会 比 指定 的 时 间 段 阻塞 更 久 。 如 果 可 
能 ， 逝 去 的 时 间 应 决定 于 勾 速 时 钟 。 


引发 


因 调 用 pred 所 引发 的 所 有 异常 ， 或 者 如 果 无 法 得 到 结果 ， 引 发 
std: :system_error ii o- 
同步 


在 单一 std: :condition _ variable 实例 上 对 
notify one(). notify all()、wait()、wait_for() 和 wait_until() 的 调 
用 会 被 序列 化 。 对 notify_one() 或 notify_all1() 的 调用 ， 只 会 唤醒 在 该 调用 之 
前 就 开始 等 待 的 线程 。 


std::condition_variable::wait_until 7% ph ZA 


直 等 待 ， 直 到 std: :condition _ variable 通过 调 
用 notify_one()、notify_all1() 或 伪 唤 醒 而 被 唤醒 ， 或 者 达到 一 个 指定 的 时 
间 ， 或 线程 被 伪 唤 醒 。 
声明 


template<typename Clock,typename Duration> 
cv status wait until( 
std::unique_ lock«std::mutex»& lock, 
std::chrono::time point«Clock,Duration» const& absolute time); 


前 置 条 件 

lock.owns_lock() 为 真 ， 且 该 锁 为 调用 线程 所 拥有 。 

结果 

原子 地 解锁 所 提供 的 lock 对 象 并 阻塞 ， 直 到 该 线程 被 另 一 个 线程 通过 调 
用 notify_one()、notify_all() 而 唤醒 ， 或 者 Clock: :now() 返 回 了 一 个 等 于 
或 晚 于 absolute_time 的 时 间 ， 或 是 线程 自己 伪 唤 醒 。 在 对 wait_until() 的 调 
用 返回 之 前 ，lock 对 象 被 再 次 锁定 。 

返回 

如 果 线 程 被 notify_one() 或 notify_all() 的 调用 唤醒 或 者 伪 唤 醒 ， 返 回 


std::cv status::no _ timeout， 人 否则 返回 std: :cv_status::timeout。 
引发 


如 果 无 法 得 到 结果 ， 引 发 std: :system_error 异 常 。 如 果 1lock 对 象 在 调 
用 wait( ) 之 中 被 解锁 ， 它 会 在 退出 时 再 次 被 锁定 ， 即 便 函 数 经 由 异常 而 退出 。 


注 ” 伪 唤醒 的 意思 是 调用 wait_unti1l() 的 线程 可 能 在 没有 线程 
调用 过 notify_one() 或 notify_all() 的 情况 下 唤醒 。 因 此 建议 如 
果 可 能 的 话 ， 首 选 接 受 断 言 的 wait_until() 重 载 版 本 。 否 则 ， 建 议 
在 一 个 测试 与 条 件 变量 关联 的 断言 的 循环 中 来 调用 wait_until()。 
没有 保证 说 调用 线程 会 被 阻塞 多 久 ， 只 有 当 函 数 返 回 false， 

且 Clock: :now() 返 回 的 时 间 等 于 或 晚 于 absolute_time 的 时 间 点 ， 
线程 才 会 解除 阻塞 。 


同步 


在 单一 std: :condition _ variable 实例 上 对 
notify one(). notify all()、wait()、wait_for() 和 wait_until() 的 调 
用 会 被 序列 化 。 对 notify_one() 或 notify_al1() 的 调用 ， 只 会 唤醒 在 该 调用 之 
前 就 开始 等 待 的 线程 。 


std::condition variable::wait until 成 员 函 数 之 接受 断言 的 重 载 版 本 


直 等 待 ， 直 到 std: :condition variable 通过 调 
用 notify_one()、notify_al1() 且 断言 为 true， 或 者 达到 直到 一 个 指定 的 时 
间 。 
声明 


template<typename Clock,typename Duration,typename Predicate> 
bool wait_until { 
std: :unique lock<std::mutex>& lock, 
std: :chrono::time_point<Clock,Duration> const& absolute time, 
Predicate pred); 


前 置 条 件 


表达 式 pred( ) 必 须 有 效 ， 且 其 返回 的 可 转换 为 boo1.1lock.owns_lock() 的 
值 必须 为 true， 且 该 锁 必 须 被 调用 wait_until() 的 线程 所 拥有 。 


结果 
类 似 于 


while (!pred()) 


{ 


if (wait_until (lock, absolute _time)==std::cv_status: : timeout) 
return pred(); 


return true; 
返回 


如 果 对 pred( ) 最 近 的 调用 返回 true， 则 返回 true， 如 果 由 relative_time 
指定 的 时 间 间 隔 逝 去 且 pred() 返 回 false， 则 返回 false。 


注 ”潜在 的 伪 唤 醒 的 意思 是 无 法 确定 pred 会 被 调用 多 少 
次 。pred 总 是 被 1ock 锁 定 的 互 斥 元 调用 ， 而 且 当 〈 且 仅 
当 ) (bool)pred() 返 回 true 或 者 Clock: :now() 返 回 一 个 等 于 或 晚 
于 absolute_time 的 时 间 ， 函 数 才 会 返回 。 没 有 保证 说 调用 线程 会 
被 阻塞 多 久 ， 只 有 当 函 数 返 回 false， 且 Clock: :now() 返 回 的 时 间 
AT mH T absolute _ time 的 时 间 点 ， 线 程 才 会 解除 阻塞 。 


引发 
因 调 用 pred 所 引发 的 所 有 异常 ， 或 者 如 果 无 法 得 到 结果 ， 引 发 


std::system error. 
同步 


在 单一 std: :condition _ variable 实例 上 对 
notify one(). notify all()、wait()、wait_for() 和 wait_until() 的 调 
用 会 被 序列 化 。 对 notify_one() 或 notify_all() 的 调用 ， 只 会 唤醒 在 该 调用 之 
前 就 开始 等 待 的 线程 。 


std::notify_all_at_thread_exit 非 成 员 函 数 


在 当前 线程 退出 时 ， 唤 醒 所 有 等 待 std: :condition _ variable 的 线程 。 


声明 


void notify all at thread exit { 
condition variable& cv,unique lock«mutex» lk); 


前 置 条 件 


lk.owns_lock() 为 trrue， 并 且 该 锁 被 调用 线程 持 有 。1k.mutex() 应 该 返回 
相同 的 值 ， 作 为 任意 提供 给 wait()、wait_for() 或 wait_until() 的 锁 对 象 ， 在 
来 自 当前 等 待 线程 的 cv 上 。 


结 
将 1k 持 有 的 锁 的 所 有 权 转 移 给 内 部 存储 ， 并 且 计划 当 调 用 线程 退出 时 通知 
cv。 此 通知 应 该 类 似 于 : 


lk.unlock({(}; 
cv.notify alli); 


引发 


如 果 无 法 达成 该 结果 ， 引 发 std:system_error 异 党 。 


注 “ 锁 会 一 直 持 有 到 线程 退出 ， 所 以 必须 小 心 避免 死 锁 。 建 议 
调用 线程 应 尽早 退出 ， 并 且 在 该 线程 上 不 要 进行 阻 蹇 操作 。 


用 户 应 该 确保 等 待 线程 不 会 在 被 唤醒 的 时 候 错 误 地 假设 线程 已 退出 ， 尤 其 有 
洪 在 的 伪 唤 醒 时 。 要 达到 这 一 目的 ， 可 以 在 等 待 线程 上 测试 一 个 只 会 做 出 true 的 
断言 ， 在 互 斥 元 的 保护 下 通知 线程 ， 量 不 在 调用 notify_all at_thread_exit 
之 前 释放 互 斥 元 上 的 锁 。 


D.2.2 std::condition_variable_any 类 


std::condition variable 类 人 允许 线程 等 待 一 个 条 件 变 为 true。 这 里 
std: :condition _ variable 只 能 与 std: :unique_lock<std: :mutex> 一 起 使 
Hj. std::condition variable_any 可 以 与 任意 符合 Lockab1le 需 求 的 类 型 一 起 
使 用 。 


std::condition _ variable_any 的 实例 ， 不 
xECopyAssignable. CopyConstructible. MoveAssignablejll 


MoveConstructib1le 的 。 


class condition_variable_any 


{ 

public: 
condition variable any(); 
-condition variable any(í); 


condition variable any( 


condition variable any const& ) = delete; 
condition variable any& operator={ 
condition variable any const& ) - delete; 


void notify one() noexcept; 
void notify allí() noexcept; 


template<typename Lockable> 
void wait (Lockable& lock); 


template <typename Lockable, typename Predicate> 
void wait (Lockable& lock, Predicate pred); 


template <typename Lockable, typename Clock,typename Duration> 
std::cv_status wait until( 

Lockable& lock, 

const std::chrono::time point«Clock, Duration»& absolute time); 


template « 
typename Lockable, typename Clock, 
typename Duration, typename Predicate» 
bool wait until( 
Lockable& lock, 
const std::chrono::time point«Clock, Duration»& absolute time, 
Predicate pred); 


template «typename Lockable, typename Rep, typename Period» 
Std::cv status wait for( 
Lockable& lock, 
const std::chrono::duration<Rep, Period»& relative time); 
template < 
typename Lockable, typename Rep, 
typename Period, typename Predicate» 
bool wait for( 
Lockable& lock, 
const std::chrono::duration<Rep, Period»& relative time, 
Predicate pred); 


T 
std::condition_variable_any 默 认 构造 函数 
构造 std: :condition _ variable_any 对 象 。 
声明 
condition variable any(); 
结果 
构造 一 个 新 的 std: :condition variable_any 实 例 。 


引发 


如 果 条 件 变 量 无 法 构造 ， 引 发 std: :system_error 类 型 的 异常 。 
std::condition_variable_any 析 构 函 数 

销毁 std: :condition variable_any 对 象 。 

声明 
~condition variable any(); 

前 置 条 件 


在 对 wait()、wait for() 和 wait_until() 的 调用 中 ， 没 有 线程 被 阻塞 
fE*this E. 


结果 
销毁 *this。 
引发 
无 。 
std::condition_variable_any::notify_one 成 员 函 数 
唤醒 当前 在 std: :condition variable_any 上 等 待 的 其 中 一 条 线程 。 
声明 
void notify one() noexcept; 
结 


在 调用 处 ， 唤 醒 在 *this 上 等 待 的 其 中 以 一 条 线程 。 如 果 没 有 线程 等 符 着 ， 
此 调用 没有 任何 效果 。 


引发 

如 果 无 法 得 到 结果 ， 引 发 std: :system_error 异 常 。 
同步 

在 单一 std: :condition variable_any 实 例 上 对 


notify one(). notify all()、wait()、wait_for() 和 wait_until() 的 调 
用 会 被 序列 化 。 对 notify_one() 或 notify_all() 的 调用 ， 只 会 唤醒 在 该 调用 之 


前 就 开始 等 待 的 线程 。 

std::condition_variable_any::notify_all 成 员 函 数 
唤醒 当前 在 std: :condition_variable_any 上 等 待 的 全 部 线程 。 
声明 

void notify all() noexcept; 
结果 


在 调用 处 ， 唤 醒 在 *this 上 等 待 的 所 有 线程 。 如 果 没 有 线程 等 待 着 ， 此 调用 
没有 任何 效果 。 


引发 
如 果 无 法 得 到 结果 ， 引 发 std: :system_error 异 常 。 
同步 
在 单一 std: :condition variable any 实例 上 对 
notify one(). notify all()、wait()、wait_for() 和 wait_until() 的 调 


用 会 被 序列 化 。 对 notify_one() 或 notify_all() 的 调用 ， 只 会 唤醒 在 该 调用 之 
前 就 开始 等 待 的 线程 。 


std::condition_variable_any::wait 成 员 函 数 


直 等 待 ， 直 到 std: :condition _ variable_any 通 过 调 
Hjnotify one(). notify al1() 而 被 唤醒 或 伪 唤 醒 。 


声明 


template«typename Lockable> 
void wait (Lockable& lock); 


前 置 条 件 

Lockable 满 足 Lockable 需 求 ， 且 lock 拥 有 锁 。 

结果 

原子 级 解锁 所 提供 的 lock 对 象 并 阻塞 ， 直 到 该 线程 被 另 一 个 线程 通过 调 


用 notify_one()、notify_al1() 而 唤醒 ， 或 是 线程 自己 伪 唤 醒 。 在 对 wait() 
的 调用 返回 之 前 ，lock 对 象 被 再 次 锁定 。 


引发 


如 果 无 法 得 到 结果 ， 引 发 std: :system_error 异 常 。 如 果 lock 对 象 在 调 
用 wait( ) 之 中 被 解锁 ， 它 会 在 退出 时 再 次 被 锁定 ， 即 便 函 数 经 由 异常 而 退出 。 


注 ” 伪 唤醒 的 意思 是 调用 wait( ) 的 线程 可 能 在 没有 线程 调用 过 
notify_one() 或 notify_all() 的 情况 下 唤醒 。 因 此 建议 如 果 可 能 
的 话 ， 首 选 接受 断言 的 wait( ) 重 载 版 本 。 否 则 ， 建 议 在 一 个 测试 与 
条 件 变 量 关 联 的 断言 的 循环 中 来 调用 wait()。 


同步 


在 单一 std: :condition _ variable_any 实 例 上 对 
notify one(). notify all()、wait()、wait_for() 和 wait_until() 的 调 
用 会 被 序列 化 。 对 notify_one() 或 notify_all1() 的 调用 ， 只 会 唤醒 在 该 调用 之 
前 就 开始 等 待 的 线程 。 


std::condition_variable_any::wait 成 员 困 数 之 接受 断言 的 重 载 厂 本 


直 等 待 ， 直 到 std: :condition _ variable_any 通 过 调 
用 notify_one()、notify_al1() 而 被 唤醒 ， 且 断言 为 true。 


声明 


template<typename Lockable,typename Predicate> 
void wait (Lockable& lock, Predicate pred); 


前 置 条 件 


表达 式 pred( ) 必 须 有 效 ， 且 其 返回 的 可 转换 为 bool.1lock.owns_lock() 的 
值 必须 为 true。Lockable 满 足 Lockable 需 求 ， 且 lock 拥 有 锁 。 


结果 
类 似 于 


while (!pred())} 


{ 
| 


wait (lock); 


引发 
因 调 用 pred 所 引发 的 所 有 异常 ， 或 者 如 果 无 法 得 到 结果 ， 引 发 


std::system error. 


注 ” 潜 在 的 伪 唤 醒 的 意思 是 无 法 确定 pred 会 被 调用 多 少 
次 。pred 总 是 被 1ock 锁 定 的 互 斥 元 调用 ， 而 且 当 《〈 且 仅 
当 ) (bool)pred() 返 回 true 时 该 函数 才 会 返回 。 


同步 


在 单一 std: :condition variable any 实例 上 对 
notify one(). notify all()、wait()、wait_for() 和 wait_until() 的 调 
用 会 被 序列 化 。 对 notify_one() 或 notify_all() 的 调用 ， 只 会 唤醒 在 该 调用 之 
前 就 开始 等 待 的 线程 。 


std::condition_variable_any::wait_for 成 员 函 数 


直 等 待 ， 直 到 std: :condition variable 通 过 调 
用 notify_one()、notify_al1() 或 伪 唤 醒 而 被 唤醒 ， 或 者 直到 一 个 指定 的 时 间 
段 逝 去 或 线程 被 伪 唤 醒 。 


声明 


template<typename Lockable,typename Rep,typename Period> 
std::cv_status wait for( 

Lockable& lock, 

std::chrono::duration«Rep,Period» const& relative time); 


前 置 条 件 


Lockable 满 足 Lockable 需 求 ， 日 lock 拥 有 和 锁 。 


ar 
zh 


原子 级 解锁 所 提供 的 lock 对 象 并 阻塞 ， 直 到 该 线程 被 另 一 个 线程 通过 调 
用 notify_one()、notify_al1() 而 唤醒 ， 或 者 relative_time 指 定 的 时 间 段 逝 
去 ， 或 是 线程 自己 伪 唤 醒 。 在 对 wait_for( ) 的 调用 返回 之 前 ，lock 对 象 被 再 次 
锁定 。 

引发 


如 果 无 法 得 到 结果 ， 引 发 std: :system_error 异 常 。 如 果 1lock 对 象 在 调 
用 wait( ) 之 中 被 解锁 ， 它 会 在 退出 时 再 次 被 锁定 ， 即 便 函 数 经 由 异常 而 退出 。 


注 ” 伪 唤醒 的 意思 是 调用 wait_for( ) 的 线程 可 能 在 没有 线程 调 
用 过 notify_one() 或 notify_all() 的 情况 下 唤醒 。 因 此 建议 如 果 
可 能 的 话 ， 首 选 接受 断言 的 wait_for( ) 重 载 版 本 。 否 则 ， 建 议 在 一 
个 测试 与 条 件 变量 关联 的 断言 的 循环 中 来 调用 wait_for()。 当 做 此 
工作 来 确保 超时 仍然 有 效 的 时 候 必须 注意 ; wait_until() 在 多 数 场 
合 下 可 能 会 更 合适 。 线 程 可 能 会 比 指定 的 时 间 段 阻塞 更 久 。 如 果 可 
能 ， 逝 去 的 时 间 应 决定 于 勾 速 时 钟 。 


同步 


在 单一 std: :condition variable _ any 实例 上 对 
notify one(). notify all()、wait()、wait_for() 和 wait_until() 的 调 
用 会 被 序列 化 。 对 notify_one() 或 notify_all() 的 调用 ， 只 会 唤醒 在 该 调用 之 
前 就 开始 等 待 的 线程 。 


std::condition_variable_any::wait_for 成 员 函 数 之 接受 断言 的 重 载 版 本 


直 等 待 ， 直 到 std: :condition variable any 通过 调 
用 notify_one()、notify_al1() 且 断言 为 true， 或 者 直到 一 个 指定 的 时 间 段 逝 
去 。 


声明 


template<typename Lockable,typename Rep, 
typename Period, typename Predicate> 
bool wait for( 
Lockable& lock, 
std::chrono::duration«Rep,Period» const& relative time, 
Predicate pred); 


前 置 条 件 


表达 式 pred( ) 必 须 有 效 ， 且 其 返回 的 可 转换 为 bool.lock。Lockable 满 足 
Lockablez;;k, HlockjdH 8i. 


结 
类 似 于 
internal clock: :time point end-internal clock: :now()+relative_ time; 


while (!pred{)) 


{ 
std: :chrono: :duration<Rep, Period> remaining _time= 
end-internal clock: :now(); 
if (wait_for (lock, remaining time) ==std::cv_status: :timeout) 
return pred(); 


} 


return true; 
返回 


如 果 对 pred() 最 近 的 调用 返回 true， 则 返回 true， 如 果 由 relative_time 
指定 的 时 间 间 隔 逝 去 且 pred() 返 回 false， 则 返回 false。 


TE “潜在 的 伪 唤 醒 的 意思 是 无 法 确定 pred 会 被 调用 多 少 
次 。pred 总 是 被 1ock 锁 定 的 互 斥 元 调用 ， 而 且 当 〔〈 且 仅 
当 ) (bool)pred() 返 回 true 或 者 relative _ time 指定 的 时 间 段 逝去 
时 该 函数 才 会 返回 。 线 程 可 能 会 比 指定 的 时 间 段 阻塞 更 久 。 如 果 可 
能 ， 逝 去 的 时 间 应 决定 于 勾 速 时 钟 。 


引发 


因 调 用 pred 所 引发 的 所 有 有 异常， 或 者 如 果 无 法 得 到 结果 ， 引 发 


std::system error. 
同步 


在 单一 std: :condition variable_any 实 例 上 对 
notify one(). notify all(). wait(). wait_for() #lwait_until() Mii 
用 会 被 序列 化 。 对 notify_one() 或 notify_all() 的 调用 ， 只 会 唤醒 在 该 调用 之 
前 就 开始 等 待 的 线程 。 


std::condition_variable::wait_until 7% ph ZA 


直 等 待 ， 直 到 std: : condition_variab1le 通 过 调 
用 notify_one()、notify_all1() 或 伪 唤 醒 而 被 唤醒 ， 或 者 达到 一 个 指定 的 时 
间 ， 或 线程 被 伪 唤 醒 。 
声明 


template<typename Lockable,typename Clock,typename Duration> 
std::cv_status wait_until ( 

Lockable& lock, 

std::chrono::time point«Clock,Duration» const& absolute time); 


前 置 条 件 

lock.owns_lock() 为 真 ， 且 该 锁 为 调用 线程 所 拥有 。 

结果 

原子 级 解锁 所 提供 的 lock 对 象 并 阻塞 ， 直 到 该 线程 被 另 一 个 线程 通过 调 
用 notify_one()、notify_al1() 而 唤醒 ， 或 者 Clock: :now() 返 回 了 一 个 等 于 
或 晚 于 absolute_time 的 时 间 ， 或 是 线程 自己 伪 唤 醒 。 在 对 wait_until() 的 调 
用 返回 之 前 ，lock 对 象 被 再 次 锁定 。 

返回 

如 果 线 程 被 notify_one() 或 notify_all() 的 调用 唤醒 或 者 伪 唤 醒 ， 返 回 


std::cv status::no _ timeout， 人 否则 返回 std: :cv_status::timeout。 
引发 


如 果 无 法 得 到 结果 ， 引 发 std: :system_error 异 常 。 如 果 1lock 对 象 在 调 
用 wait( ) 之 中 被 解锁 ， 它 会 在 退出 时 再 次 被 锁定 ， 即 便 函 数 经 由 异常 而 退出 。 


注 ” 伪 唤醒 的 意思 是 调用 wait( ) 的 线程 可 能 在 没有 线程 调用 过 
notify_one() 或 notify_all() 的 情况 下 唤醒 。 因 此 建议 如 果 可 能 
的 话 ， 首 选 接受 断言 的 wait() 重 载 版 本 。 否 则 ， 建 议 在 一 个 测试 与 
条 件 变量 关联 的 断言 的 循环 中 来 调用 wait_until()。 没 有 保证 说 调 
用 线程 会 被 阻塞 多 久 ， 只 有 当 函 数 返 回 false， 且 Clock: :now() 返 
回 的 时 间 等 于 或 晚 于 absolute _ time 的 时 间 点 ， 线 程 才 会 解除 阻 
塞 。 


同步 


在 单一 std: :condition_variable_any 实 例 上 对 
notify one(). notify all()、wait()、wait_for() 和 wait_until() 的 调 
用 会 被 序列 化 。 对 notify_one() 或 notify_all() 的 调用 ， 只 会 唤醒 在 该 调用 之 
前 就 开始 等 待 的 线程 。 


std::condition variable::wait until 成 员 函 数 之 接受 断言 的 重 载 版 本 


直 等 待 ， 直 到 std: :condition variable 通 过 调 
用 notify_one()、notify_al1() 且 断言 为 true， 或 者 直到 达到 一 个 指定 的 时 
IH] 。 


声明 


template<typename Lockable,typename Clock, 
typename Duration, typename Predicate> 
bool wait until(í 
Lockable& lock, 
std::chrono::time point«Clock,Duration» const& absolute time, 
Predicate pred); 


前 置 条 件 


表达 式 pred( ) 必 须 有 效 ， 且 其 返回 的 可 转换 为 boo1.1lock.owns_lock() 的 
值 必须 为 true， 且 该 锁 必 须 被 调用 wait( ) 的 线程 所 拥有 。 


结果 
类 似 于 


while (!pred()) 


{ 
if (wait_until (lock, absolute _time)==std::cv_status: : timeout) 
return pred(); 
} 
return true; 


返回 


如 果 对 pred( ) 最 近 的 调用 返回 true， 则 返回 true， 如 果 由 relative_time 
指定 的 时 间 间 隔 逝 去 且 pred() 返 回 false， 则 返回 false。 


注 “ 淤 在 的 伪 唤 醒 的 意思 是 无 法 确定 pred 会 被 调用 多 少 
次 。pred 总 是 被 1ock 锁 定 的 互 斥 元 调用 ， 而 且 当 《〈 且 仅 
当 ) (bool)pred() 返 回 true 或 者 Clock: :now() 返 回 一 个 等 于 或 晚 
于 absolute_time 的 时 间 ， 函 数 才 会 返回 。 没 有 保证 说 调用 线程 会 
被 阻塞 多 久 ， 只 有 当 函 数 返 回 false， 且 Clock: :now() 返 回 的 时 间 
AT mH T absolute _ time 的 时 间 点 ， 线 程 才 会 解除 阻塞 。 


引发 
因 调 用 pred 所 引发 的 所 有 异常 ， 或 者 如 果 无 法 得 到 结果 ， 引 发 


std::system error. 
同步 


在 单一 std: :condition variable any 实例 上 对 
notify one(). notify all()、wait()、wait_for() 和 wait_until() 的 调 
用 会 被 序列 化 。 对 notify_one() 或 notify_ al1() 的 调用 ， 只 会 唤醒 在 该 调用 之 
前 就 开始 等 待 的 线程 。 


D.3 ”<atomic> 头 文件 


<atomic> 头 文件 提供 了 一 组 基本 的 原子 类 型 以 及 对 这 些 类 型 的 操作 ， 还 有 一 
个 类 模板 ， 用 来 构造 满足 一 些 条 件 的 用 户 定义 类 型 的 原子 版 本 。 


头 文件 内 容 


#define 
#define 
#define 
#define 
#define 
#define 
#define 
#define 
#define 
#define 


ATOMIC_BOOL_LOCK_FREE see description 
ATOMIC CHAR LOCK FREE see description 
ATOMIC SHORT LOCK FREE see description 
ATOMIC_INT_LOCK_FREE see description 
ATOMIC LONG LOCK FREE see description 
ATOMIC LLONG LOCK FREE see description 
ATOMIC CHAR16 T LOCK FREE see description 
ATOMIC CHAR32 T LOCK FREE see description 
ATOMIC WCHAR T LOCK FREE see description 
ATOMIC POINTER LOCK FREE see description 


#define 


namespace std 


{ 


ATOMIC VAR INIT (value) 


enum memory order ; 


struct atomic flag; 


typedef 
typedef 
typedef 
typedef 
typedef 
typedef 
typedef 
typedef 
typedef 
typedef 
typedef 
typedef 
typedef 
typedef 
typedef 


typedef 
typedef 
typedef 
typedef 


see 
see 
Ses 
sce 
see 
see 
see 
see 
see 
see 
Ses 
see 
see 
see 
see 


see 
see 
see 
see 


description 
description 
description 
description 
description 
description 
description 
description 
description 
description 
description 
description 
description 
description 
description 


description 
description 
description 
description 


see description 


atomic_bool; 
atomic char; 
atomic char16 t; 
atomic char32 t; 
atomic schar; 
atomic uchar; 
atomic short; 
atomic ushort; 
atomic int; 
atomic uint; 
atomic long; 
atomic ulong; 
atomic llong; 
atomic ullong; 
atomic wchar t; 


atomic int least8 t; 
atomic uint least8 t; 
atomic int leastle t; 
atomic uint leastl16 t; 


typedef see description atomic int least32 t; 
typedef see description atomic uint least32 t; 
typedef see description atomic int least64 t; 
typedef see description atomic uint least64 t; 
typedef see description atomic int fastB8 t; 
typedef see description atomic uint fasts t; 
typedef see description atomic int fast16 t; 
typedef see description atomic uint fasti16 t; 
typedef see description atomic int fast32 t; 
typedef see description atomic uint fast32 t; 
typedef see description atomic int fast64 t; 
typedef see description atomic uint fast64 t; 
typedef see description atomic int8 t; 
typedef see description atomic uint8 t; 
typedef see description atomic intle t; 
typedef see description atomic uint16 t; 
typedef see description atomic int32 t; 
typedef see description atomic uint32 t; 
typedef see description atomic int64 t; 
typedef see description atomic uint64 t; 
typedef see description atomic intptr t; 
typedef see description atomic uintptr t; 
typedef see description atomic size t; 
typedef see description atomic ssize t; 
typedef see description atomic ptrdiff t; 
typedef see description atomic intmax t; 
typedef see description atomic uintmax t; 


template<typename T» 
struct atomic; 


extern "C" void atomic thread fence(memory order order); 
extern "C" void atomic signal fence(memory order order); 


template«typename T> 
T kill dependency (T); 


D.3.1 std::atomic xxx typedef 
为 了 向 下 兼容 C 标 准 ， 提 供 了 原子 整 型 的 typedef。 这 既是 对 相应 


std: :atomic<T> 特 化 的 typedef， 
std::atomicitype 


std::atomic_char 
std::atomic_schar 
std::atomic_uchar 
std::atomic_short 
std::atomic_ushort 
std::atomic_int 
std::atomic_uint 
std::atomic_long 
std::atomic_ulong 
std::atomic_llong 
std::atomic_ullong 
std::atomic_wchar_t 
std::atomic_char16_t 
std::atomic_char32_t 


也 是 具有 相同 接口 特 化 的 基 类 。 


std::atomic<> 特 化 


std::atomic<char> 
std::atomic<signed char> 
std::atomic<unsigned char> 
std::atomic<short> 
std::atomic<unsigned short> 
std::atomic<int> 
std::atomic<unsigned int> 
std::atomic<long> 
std::atomic<unsigned long> 
std::atomic<long long> 
std::atomic<unsigned long long> 
std::atomic<wchar_t> 
std::atomic«char16 t» 
std::atomic«char32 t» 


D.3.2 ATOMIC xxx LOCK FREEZ: 


这 些 
宏 声 明 


些 宏 确 定 了 对 应 特定 内 置 类 型 的 源 自 类 型 是 不 是 无 锁 的 。 


#define ATOMIC BOOL LOCK FREE see description 
#define ATOMIC CHAR LOCK FREE see description 
#define ATOMIC SHORT LOCK FREE see description 
#define ATOMIC INT LOCK FREE see description 
#define ATOMIC LONG LOCK FREE see description 
#define ATOMIC LLONG LOCK FREE see description 
#define ATOMIC CHAR16 T LOCK FREE see description 
#define ATOMIC CHAR32 T LOCK FREE see description 
define ATOMIC WCHAR T LOCK FREE see description 
#define ATOMIC POINTER LOCK FREE see description 


ATOMIC_xxx_LOCK_FREE 的 值 是 0、1 或 2。 值 0 表示 该 操作 对 于 提名 类 型 对 应 
的 有 符号 和 无 符号 原子 类 型 从 来 都 不 是 无 锁 的 ， 值 1 表示 该 操作 对 于 那些 类 型 在 
特定 场合 下 可 能 是 无 锁 的 ， 而 其 他 场合 则 不 是 ， 值 2 表示 该 操作 始终 是 无 锁 的 。 


例如 ， 如 果 ATOMIC_INT_LOCK_FREE 是 2，std: :atomic<int> 和 
std: :atomic<unsigned> 上 的 操作 始终 是 无 锁 的 。 


ATOMIC_POINTER_LOCK_FREE 宏 描述 了 在 原子 指针 特 化 std: :atomic«T*» E 
的 操作 的 无 锁 属 性 。 


D.3.3 ATOMIC VAR INIT/Z 
ATOMIC_VAR_INIT 宏 提供 了 将 原子 变量 初始 化 至 特定 值 的 方法 。 
声明 

#define ATOMIC VAR INIT(value) see description 


这 个 宏 展开 至 令 牌 序列 ， 能 够 以 下 面 的 形式 ， 用 来 在 表达 式 里 使 用 指定 值 初 
始 化 标准 原子 类 型 : 


std: :atomic<type> x = ATOMIC VAR INIT(val); 
指定 的 值 必须 与 对 应 于 原子 类 型 的 非 原子 类 型 相 兼 容 ， 例 如 : 


std::atomic<int> i = ATOMIC VAR INIT(42) ; 
std::string s; 
std::atomic«std::string*- p = ATOMIC VAR INIT (&s} ; 


这 样 的 初始 化 不 是 原子 的 ， 并 且 任 何 通过 其 他 线程 访问 即将 初始 化 的 变量 
时 ， 初 始 化 没有 发 生 于 访问 之 前 就 会 产生 数据 竞争 而 且 是 未 定义 的 行为 。 


D.3.4 std::memory_order 枚 举 
std: :memory_order 枚 举 用 来 指定 原子 操作 的 排序 约束 。 
声明 
typedef enum memory_order 
{ 
memory order relaxed,memory order consume, 
memory order acquire,memory order release, 
memory order acg rel,memory order seq cst 
) memory order; 


标记 有 这 些 内 存 顺序 值 的 操作 表现 如 下 (参见 第 5 章 )〉。 


std::memory_order_relaxed 


此 操作 不 会 提供 任何 额外 的 排序 约束 。 
std::memory_order_release 


此 操作 是 在 指定 内 存 地 点 的 释放 操作 。 它 因此 在 与 一 个 读 取 存 储 值 相同 内 存 
地 点 的 获取 操作 同步 。 


std::memory_order_acquire 


此 操作 是 在 指定 内 存 地 点 的 获取 操作 。 如 果 存 储 的 值 被 一 个 释放 操作 所 写 ， 
则 该 存储 与 此 操作 同步 。 


std::memory order acq rel 


此 操作 必须 是 读 -修改 - 写 操作 ， 并 且 在 指定 地 点 同时 表现 


为 std: :memory order acquirejflistd::memory order release. 


std::memory order seq cst 

此 操作 构成 顺序 一 致 操作 的 一 个 全 局 总 体 排 序 的 一 部 分 。 另 外 ， 如 果 这 是 个 
存储 ， 它 表现 为 std: :memory_order_release 操 作 ; 如 果 这 是 个 载 入 ， 它 表现 
为 std: :memory_order_acquire 操 作 ; 如 果 它 是 读 -修改 - 写 操 作 ， 它 同时 表现 
为 std: :memory_order_acquire 和 std::memory_order_release。 这 是 所 有 
操作 的 默认 值 。 
std::memory_order_consume 

此 操作 是 在 指定 的 内 存 位 置 的 消费 操作 。 
D.3.5  std::atomic_thread_fence ri ZW 


std: :atomic _ thread_fence() 在 代码 中 插入 一 个 “内 存 障碍 ?或 是 “屏障 ”， 
以 便 在 操作 之 间 强 制 内 存 顺序 约束 。 


声明 

extern "C" void atomic thread fence(std::memory order order); 
结果 
插入 一 个 带 有 所 需 内 存 顺 序 约 束 的 屏障 。 


"jstd::memory order release. std::memory order acq rel 


或 std: :memory_order_seq_cst 的 order 的 屏障 ， 与 相同 内 存 地 址 上 的 获取 操 


I 如 果 该 获取 操作 读 取 一 个 由 屏障 后 面 原子 操作 存储 的 值 在 相同 的 线程 


释放 操作 与 带 
有 std: :memory_order acquire. std::memory order acq relzk 
std::memory order_seq_cst 的 order 的 屏障 同步 ， 如 果 该 释放 操作 存储 一 个 
被 屏障 前 的 原子 操作 读 取 的 值 。 


引发 
无 。 


D.3.6 std::atomic_signal_fenceré 2 


std: :atomic_signal_fence() 函 数 在 代码 中 插入 一 个 内 存 障碍 或 屏障 ， 以 
便 在 线程 上 的 操作 和 线程 上 信号 句柄 中 的 操作 之 间 强 制 内 存 顺序 约束 


声明 
extern "C" void atomic signal fence(std::memory order order); 
AR 
插入 一 个 带 有 所 需 内 存 顺序 约束 的 屏障 。 等 效 于 
std::atomic thread_fence(order)， 除 了 此 约束 只 应 用 在 线程 和 同一 线程 上 
的 信号 句柄 之 间 。 
引发 
无 。 


D.3.7 std::atomic_flag% 


std::atomic flag 类 提供 了 原子 flag 的 简单 骨架 。 这 是 C++11 标 准 唯一 保证 
为 无 锁 的 数据 类 型 〈 尽 管 很 多 原子 类 型 在 大 多 数 实现 中 也 是 无 锁 的 ) 。 


std::atomic flag 的 实例 要 么 是 set 要 么 是 clear。 


struct atomic flag 
{ 
atomic flag() noexcept = default; 
atomic_flag(const atomic_flag&) = delete; 
atomic flag& operator=(const atomic _flag&) = delete; 
atomic_flag& operator=(const atomic_flag&) volatile = delete; 


bool test_and_set (memory_order = memory order seq cst) volatile 
noexcept ; 

bool test_and_set (memory_order = memory order seq cst) noexcept; 

void clear(memory order = memory order seq cst) volatile noexcept 

void clear(memory order = memory order seq cst) noexcept; 


y; 


bool atomic flag test_and_set(volatile atomic flag*) noexcept; 
bool atomic flag test and set (atomic flag*) noexcept; 
bool atomic flag test and set explicit( 


volatile atomic flag*, memory order) noexcept; 
bool atomic flag test and set explicit( 
atomic flag*, memory order) noexcept; 
void atomic flag clear(volatile atomic flag*) noexcept; 
void atomic flag clearí(atomic flag*) noexcept; 
void atomic flag clear explicit( 
volatile atomic flag*, memory order) noexcept; 
void atomic flag clear explicit( 
atomic flag*, memory order) noexcept; 


#define ATOMIC FLAG INIT unspecified 
std::atomic flagZA iA 1435 pK BL 


默认 构造 的 std: :atomic_flag 实 例 是 clear 还 是 set 是 未 指定 的 。 对 于 静态 存 
储 时 限 的 对 象 ， 初 始 化 应 该 是 静态 初始 化 。 


声明 


std: :atomic_flag() noexcept = default; 


结 
构造 在 未 指定 的 状态 的 新 的 std: :atomic flag]. 
引发 
Tee 
std::atomic_flag 使 用 atomic_flag_init 初 始 化 


std::atomic flag 的 实例 可 以 使 用 ATOMIC_FLAG_INIT 宏 来 初始 化 ， 这 种 
情况 下 它 会 初始 化 为 clear 状 态 。 对 于 静态 存储 时 限 的 对 象 ， 初 始 化 应 该 是 静态 初 


始 化 。 
声明 

#define ATOMIC FLAG INIT unspecified 
用 法 

std::atomic flag flag-ATOMIC FLAG INIT; 
结 
构造 在 clear 状 态 的 新 的 std: :atomic fl1ag 对 象 。 
引发 
无 。 

std::atomic flag::test_and_set 成 员 函 数 
原子 级 设置 flag， 并 检查 它 是 不 是 已 设置 。 
声明 


bool test and set (memory_order order = memory order seq cst) volatile 
noexcept; 
bool test and set (memory order order = memory order seq cst) noexcept; 


结果 

设置 flag。 

返回 

如 果 flag 在 调用 处 是 已 设置 的 ， 返 回 true， 如 果 flag 是 清除 的 ， 返 回 false。 
引发 

TE» 


注 ” 这 是 一 项 对 于 包括 *this 的 内 存 地 址 的 原子 的 读 -修改 - 写 操 


作 。 


std::atomic flag test_and_set 非 成 员 函 数 
设置 flag， 并 检查 它 是 不 是 已 设置 。 
声明 


bool atomic flag test and set (volatile atomic flag* flag) noexcept; 
bool atomic flag test and set (atomic flag* flag) noexcept; 


结果 


return flag-»test and set(); 


std::atomic flag test and set, explicit4F AX mm PK žk 
设置 fag， 并 检查 它 是 不 是 已 设置 。 
声明 


bool atomic flag test and set explicit { 

volatile atomic flag* flag, memory order order) noexcept; 
bool atomic flag test and set explicit( 

atomic flag* flag, memory order order) noexcept; 


返回 


return flag-»test and set (order) ; 


std::atomic_flag::clear HX 5i RA BL 
清除 flag。 
声明 


void clear(memory_order order = memory_order_seq_cst) volatile noexcept; 
void clear(memory order order = memory order seq cst) noexcept; 


前 置 条 件 


提供 的 order 必 须 
XEstd::memory order relaxed. std::memory order release 


或 std: :memory order _seq_cst 其 中 之 一 。 
结 
清除 flag。 
引发 
Jáe 


注 ”这 是 对 包括 *this 的 内 存 地 址 的 原子 存储 操作 。 


std::atomic_flag_clear 非 成 员 函 数 
清除 flag。 
声明 


void atomic flag clear(volatile atomic flag* flag) noexcept; 
void atomic flag clear(atomic flag* flag) noexcept; 


结果 
Fflag-»clear(); 
std::atomic flag clear explicit4F AX 1 PK Zt 
清除 flag。 
声明 
void atomic flag clear_explicit ( 
volatile atomic_flag* flag, memory_order order) noexcept; 
void atomic flag clear explicit ( 
atomic flag* flag, memory order order) noexcept; 


an 
结 


return flag->clear (order) ; 


D.3.8 std::atomic 关 模板 
std: :atomic 类 模板 提供 了 一 个 带 有 原子 操作 的 封装 器 ， 可 以 用 于 任意 符合 
下 面 需求 的 类 型 。 
模板 参数 BaseType 必 须 具 备 如 下 特点 。 
。 有 平凡 的 默认 构造 函数 。 
。 有 平凡 的 拷贝 赋值 运算 符 。 


° AP ALRI HEU PR l 
e 可 以 进行 按 位 相等 比较 。 
这 基本 上 意味 着 std: :atomic<some-built-in-type> 是 正确 的 ， 正 如 
std: :atomic<some-simple-struct>， 但 像 std: :atomic<std: :string> 这 样 
的 就 不 行 了 。 


在 主 模板 之 外 ， 还 有 为 内 置 整 型 而 设 的 特 化 ， 和 提供 类 似 x++ 这 样 额外 操作 
的 指针 。 


std: :atomic 的 实例 不 是 CopyConstructible 和 CopyAssignable 的 ， 因 为 
这 些 操作 都 不 能 作为 一 个 单一 原子 操作 来 进行 。 


template<typename BaseType> 
struct atomic 


{ 


atomic() noexcept = default; 

constexpr atomic (BaseType) noexcept; 

BaseType operator=(BaseType) volatile noexcept; 
BaseType operator-(BaseType) noexcept; 


atomic(const atomic&) = delete; 
atomic& operator-(const atomic&) - delete; 
atomic& operator= {const atomic&) volatile = delete; 


bool is lock free() const volatile noexcept; 
bool is lock free() const noexcept; 
void store(BaseType,memory order - memory order seq cst) 
volatile noexcept; 
void store(BaseType,memory order = memory order seq cst) noexcept; 
BaseType load(memory order = memory order seq cst) 
const volatile noexcept; 
BaseType load(memory order = memory order seg cst) const noexcept; 
BaseType exchange(BaseType,memory order - memory order seq cst) 
volatile noexcept; 
BaseType exchange (BaseType,memory order = memory order seq cst) 
noexcept; 


bool compare exchange strong( 

BaseType & old value, BaseType new value, 

memory order order - memory order seq cst) volatile noexcept; 
bool compare exchange strong( 

BaseType & old value, BaseType new value, 

memory order order - memory order seq cst) noexcept; 
bool compare exchange strong( 

BaseType & old value, BaseType new value, 

memory order success order, 

memory order failure order) volatile noexcept; 
bool compare exchange strongí 

BaseType & old value, BaseType new value, 

memory order success order, 

memory order failure order) noexcept; 
bool compare exchange weak(í 

BaseType & old value, BaseType new value, 

memory order order - memory order seq cst) 

volatile noexcept; 
bool compare exchange weak(í 

BaseType & old value, BaseType new value, 

memory order order - memory order seq cst) noexcept; 
bool compare exchange weak( 

BaseType & old value, BaseType new value, 

memory order success order, 

memory order failure order) volatile noexcept; 
bool compare exchange weak( 

BaseType & old value, BaseType new value, 

memory order success order, 

memory order failure order) noexcept; 


operator BaseType () const volatile noexcept; 
operator BaseType () const noexcept; 
bs 
template<typename BaseType> 
bool atomic_is_lock_free(volatile const atomic<BaseType>*) noexcept; 
template«typename BaseType» 
bool atomic is lock free(const atomic<BaseType>*) noexcept; 
template<typename BaseType> 
void atomic inití(volatile atomic<BaseType>*, void*) noexcept; 
template<typename BaseType> 
void atomic init(atomic«BaseType»*, void*) noexcept; 
template<typename BaseType> 
BaseType atomic_exchange(volatile atomic<BaseType>*, memory_order) 
noexcept ; 
template<typename BaseType> 
BaseType atomic_exchange (atomic<BaseType>*, memory order) noexcept; 
template«typename BaseType> 
BaseType atomic exchange explicit( 
volatile atomic«BaseType»*, memory order) noexcept; 
template<typename BaseType> 
BaseType atomic exchange explicit ( 
atomic<BaseType>*, memory order) noexcept; 
template<typename BaseType> 
void atomic store(volatile atomic«BaseType»*, BaseType) noexcept; 
template<typename BaseType> 
void atomic store(atomic«BaseType»*, BaseType) noexcept; 
template«typename BaseType> 
void atomic store explicit( 
volatile atomic<BaseType>*, BaseType, memory order) noexcept; 
template<typename BaseType> 
void atomic_store_explicit ( 
atomic<BaseType>*, BaseType, memory_order) noexcept; 
template<typename BaseType> 
BaseType atomic load(volatile const atomic<BaseType>*) noexcept; 
template<typename BaseType> 
BaseType atomic_load(const atomic<BaseType>*) noexcept; 
template<typename BaseType> 
BaseType atomic load explicit( 
volatile const atomic«BaseType»*, memory order) noexcept; 
template«typename BaseType> 
BaseType atomic load explicit( 
const atomic<BaseType>*, memory order) noexcept; 
template«typename BaseType> 
bool atomic compare exchange strong( 
volatile atomic<BaseType>*,BaseType * old value, 
BaseType new value) noexcept; 
template<typename BaseType> 
bool atomic compare exchange strong( 
atomic«BaseType»*,BaseType * old value, 
BaseType new value) noexcept; 
template<typename BaseType> 
bool atomic compare exchange strong explicit ( 
volatile atomic<BaseType>*,BaseType * old value, 
BaseType new value, memory order success order, 
memory order failure order) noexcept; 


template<typename BaseType> 

bool atomic compare exchange strong explicit ( 
atomic«BaseType»*,BaseType * old value, 
BaseType new value, memory order success order, 
memory order failure order) noexcept; 

template«typename BaseType» 

bool atomic compare exchange weak ({ 
volatile atomic<BaseType>*,BaseType * old value,BaseType new value) 
noexcept; 

template«typename BaseType» 

bool atomic compare exchange weakí 
atomic«BaseType»*,BaseType * old value,BaseType new value) noexcept; 

template«typename BaseType> 

bool atomic compare exchange weak explicit( 
volatile atomic«BaseType»*,BaseType * old value, 
BaseType new value, memory order success order, 
memory order failure order) noexcept; 

template«typename BaseType> 

bool atomic compare exchange weak explicit( 
atomic«BaseType»*,BaseType * old value, 
BaseType new value, memory order success order, 
memory order failure order) noexcept; 


注 尽管 这 些 非 成 员 函 数 和 被 指定 为 模板 ， 它 们 可 以 作为 函数 的 
重 载 集 来 提供 ， 且 不 应 该 使 用 模板 参数 的 显 式 特 化 。 


std::atomic 默 认 构造 函数 
使 用 默认 初始 化 值 构造 std: :atomic 的 实例 。 
声明 

atomic() noexcept; 
结果 


使 用 默认 初始 化 值 构造 一 个 新 的 std: :atomic 的 实例 。 对 于 静态 存储 时 限 的 
对 象 ， 初 始 化 应 该 是 静态 初始 化 。 


注 ”使 用 默认 构造 函数 初始 化 的 带 有 非 静 态 存 储 时 限 的 
std: :atomic 实 例 ， 不 能 指望 它 拥 有 一 个 可 预见 的 值 。 


引发 
Fie 
std::atomic_int 非 成 员 函 数 
在 std: :atomic<BaseType> 的 实例 中 非 原子 级 存储 给 定 的 值 。 
声明 


template<typename BaseType> 
void atomic init(atomic«BaseType» volatile* p, BaseType v) noexcept; 


template<typename BaseType> 
void atomic_init (atomic<BaseType>* p, BaseType v) noexcept; 


结果 


非 原 子 级 将 v 的 值 存储 在 *p 中 。 在 一 个 尚未 默认 构造 的 或 是 在 构造 后 已 进行 
过 任何 操作 的 atomic<BaseType> 实 例 上 调用 atomic_init()， 都 是 未 定义 的 行 


TE ”由 于 该 存储 是 非 原子 的 ， 所 有 来 自 于 男 一 线程 的 对 p 所 指 癌 
的 对 象 的 并 发 访问 《即便 是 原子 的 ) 均 构 成 数据 竞争 。 


引发 
Jus 
std::atomic 转 换 构造 函数 
用 给 定 的 BaseType 值 构造 std: :atomic 实 例 。 


声明 


constexpr atomic(BaseType b) noexcept; 
结果 


用 b 的 值 构造 新 的 std: :atomic 对 象 。 对 于 静态 存储 时 限 的 对 象 这 是 静态 初 
始 化 。 


引发 

X. 
std::atomic 转 换 赋值 运算 符 

在 *this 中 存储 一 个 新 的 值 。 

声明 


BaseType operator-(BaseType b) volatile noexcept; 
BaseType operator=(BaseType b) noexcept; 


结果 


return this-»store(b); 


std::atomic::is lock free 成 员 函 数 


确定 在 *this 上 的 操作 是 无 锁 的 。 


声明 
bool is lock free() const volatile noexcept; 
bool is lock free() const noexcept; 

返回 

如 有 果 在 *this 上 的 操作 是 无 锁 的 ， 返 回 true， 人 否则 false。 

引发 

无 。 


std::atomic::is lock freedEJX 51 PR ži 
确定 在 *this 上 的 操作 是 无 锁 的 。 


— 
声明 
template«typename BaseType> 


bool atomic_is_lock_free(volatile const atomic<BaseType>* p) noexcept; 


template<typename BaseType> 
bool atomic is lock free(const atomic<BaseType>* p) noexcept; 


结果 
return p-»is lock free(); 
std::atomic::loadJX 5i PK Zt 
原子 级 载 入 std: :atomic 实 例 的 当前 值 。 
声明 
BaseType load(memory_order order = memory order seq cst} 


const volatile noexcept; 
BaseType load(memory_ order order = memory order seq cst) const noexcept; 


前 置 条 件 


提供 的 order 必 须 
XEstd::memory order relaxed. std::memory order release 
BEstd::memory order seq cstdH 2 —. 


结 
原子 级 载 入 存储 在 *this 中 的 值 。 
返回 


在 调用 时 *this 中 存储 的 值 。 
引发 
无 。 


TE ”这 是 对 包括 *this 的 内 存 地 址 的 原子 载 入 操作 。 


std::atomic load 非 成 员 函 数 
原子 级 载 入 std: :atomic 实 例 的 当前 值 。 
声明 


template<typename BaseType> 

BaseType atomic load(volatile const atomic<BaseType>* p) noexcept; 
template«typename BaseType» 

BaseType atomic load(const atomic«BaseType»* p) noexcept; 


2 

return p-»load(); 

std::atomic_load 非 成 员 函 数 
原子 级 载 入 std: :atomic 实 例 的 当前 值 。 
声明 


template<typename BaseType> 
BaseType atomic load explicit( 
volatile const atomic<BaseType>* p, memory order order) noexcept; 
template«typename BaseType> 
BaseType atomic load explicit( 
const atomic«BaseType»* p, memory order order) noexcept; 


结果 
return p-»load(order); 
std::atomic::operator 基 类 型 转换 运算 符 
载 入 存储 在 *this 中 的 值 。 
声明 


operator BaseType() const volatile noexcept; 
operator BaseType() const noexcept; 


结果 
return this->load(}; 


std::atomic::storeJX, 5i pK Zi 


在 atomic<BaseType> 实 例 中 存储 一 个 新 值 。 


二 
声明 

void storeí(BaseType new value,memory order order = memory order seq cst) 
volatile noexcept; 


void store(BaseType new value,memory order order = memory order seq cst) 
noexcept ; 


前 置 条 件 

提供 的 order 必 须 
是 std: :memory_order_relaxed, std::memory_order_release 
BEstd::memory order _seq_cst 其 中 之 一 。 

结 

在 *this 中 存储 new_value。 

引发 


无 。 


注 “ 这 是 对 包括 *this 的 内 存 地 址 的 原子 存储 操作 。 


std::atomic_store 非 成 员 函 数 
在 atomic<BaseType> 实 例 中 存储 一 个 新 值 。 
声明 


template<typename BaseType> 

void atomic store(volatile atomic<BaseType>* p, BaseType new value) 
noexcept; 

template«typename BaseType> 

void atomic store(atomic«BaseType»* p, BaseType new value) noexcept; 


结果 


P->Store (new value); 


std::atomic_store_explicit 非 成 员 函 数 
在 atomic<BaseType> 实 例 中 存储 一 个 新 值 。 
声明 
template<typename BaseType> 
void atomic_store_explicit ( 
volatile atomic«BaseType»* p, BaseType new value, memory order order) 
noexcept ; 
template<typename BaseType> 


void atomic_store_explicit ( 
atomic<BaseType>* p, BaseType new value, memory order order) noexcept; 


结果 
p->store (new value, order} ; 
std::atomic::exchange/X 5i pK BL 

存储 一 个 新 值 并 读 取 旧 值 。 

声明 


BaseType exchange ( 
BaseType new value, 
memory order order = memory order seq cst) 
volatile noexcept; 


结果 

在 *this 中 存储 new_value， 并 且 获 取现 存 的 *this 值 。 
返回 

在 刚刚 存储 之 前 的 *this 值 。 

引发 

JE 


注 ” 这 是 一 项 对 于 包括 *this 的 内 存 地 址 的 原子 的 读 -修改 - 写 操 


作 。 


std::atomic_exchange 非 成 员 函 数 
在 atomic<BaseType> 实 例 中 存储 一 个 新 的 值 并 且 读 取 之 前 的 值 。 


声明 


template<typename BaseType> 

BaseType atomic exchange (volatile atomic«BaseType»* p, BaseType new value) 
noexcept; 

template«typename BaseType» 

BaseType atomic exchangeí(atomic«BaseType»* p, BaseType new value) noexcept; 


E 
return p-»exchange(new value); 
std::atomic exchange explicit4F 5X i PK Zt 
在 atomic<BaseType> 实 例 中 存储 一 个 新 的 值 并 且 读 取 之 前 的 值 。 


声明 


template<typename BaseType> 

BaseType atomic exchange explicit ( 
volatile atomic<BaseType>* p, BaseType new value, memory order order) 
noexcept; 

template«typename BaseType> 

BaseType atomic exchange explicit( 
atomic«BaseType»* p, BaseType new value, memory order order) noexcept; 


Zh 
return p-»exchange (new value,order); 
std::atomic::compare exchange strong/X 5i P AL 


原子 级 将 值 与 一 个 期 望 值 进行 比较 ， 并 且 如 果 两 个 值 相等 ， 就 存储 新 的 值 。 
如 果 两 个 值 不 相等 ， 就 用 读 取 到 的 值 更 新 期 望 值 。 


声明 


bool compare exchange strong ( 
BaseType& expected,BaseType new value, 
memory order order - std::memory order seq cst) volatile noexcept; 
bool compare exchange strong( 
BaseType& expected,BaseType new value, 
memory order order - std::memory order seq cst) noexcept; 
bool compare exchange strong( 
BaseType& expected,BaseType new value, 
memory order success order,memory order failure order) 
volatile noexcept; 
bool compare exchange strong( 
BaseType& expected,BaseType new value, 
memory order success order,memory order failure order) noexcept; 


前 置 条 件 


failure_order 不 能 是 std: :memory_order_release 
Bkstd::memory order acq rel. 


结果 


将 expected 与 *this 中 存储 的 值 进 行 按 位 比较 ， 并 且 当 相等 时 将 new_value 
存储 在 *this 中 ， 和 否则 ， 将 expected 更 新 为 读 取 到 的 值 。 


返回 
如 果 *this 中 存在 的 值 与 expected 相 等 ， 返 回 true， 否 则 false。 
引发 
Jee 


注 “ 三 参数 的 重 载 与 带 有 success_order==order 和 
failure_order==order 的 四 参数 重 载 是 等 效 的 ， 除 非 order 
XEstd::memory order acq relifjfailure order 
是 std: :memory order acquire, 或 者 order 
XEstd::memory order releaseifjfailure order 
是 std: :memory order relaxed. 


注 “ 如 果 结 果 为 true， 这 就 是 对 包括 *this 的 内 存 地 址 的 原子 
读 -修改 - 写 操作 ， 带 有 内 存 顺 序 success_order; 否则 ， 它 就 是 对 包 
括 *this 的 内 存 地 址 的 载 入 操作 ， 带 有 内 存 顺 序 failure_order。 


std::atomic_compare_exchange_strong 非 成 员 函 数 


将 值 与 一 个 期 望 值 进 行 比较 ， 并 且 如 果 两 个 值 相等 ， 就 存储 新 的 值 。 如 果 两 
个 值 不 相等 ， 就 用 读 取 到 的 值 更 新 期 望 值 。 


声明 


template<typename BaseType> 

bool atomic_compare_exchange_strong({ 
volatile atomic<BaseType>* p,BaseType * old value,BaseType new value) 
noexcept; 

template<typename BaseType> 

bool atomic compare exchange strong { 
atomic«BaseType»* p,BaseType * old value,BaseType new value) noexcept; 


结果 
return p-»compare exchange strong(*old value,new value); 
std::atomic::compare exchange weakJk 5i bj Zi 

将 值 与 一 个 期 望 值 进行 比较 ， 并 且 如 果 两 个 值 相等 且 更 新 可 以 在 原子 级 完 
成 ， 束 存储 新 的 值 。 如 果 两 个 值 不 相等 或 是 更 新 不 能 在 原子 级 完成 ， 就 用 读 取 到 
的 值 更 新 期 望 值 。 


声明 


bool compare exchange _ weak ( 
BaseType& expected, BaseType new_value, 
memory order order = std::memory order seq cst) volatile noexcept; 
bool compare exchange weak( 
BaseType& expected,BaseType new value, 
memory order order = std::memory order seq cst) noexcept; 
bool compare exchange weak(í 
BaseType& expected,BaseType new value, 
memory order success order,memory order failure order) 
volatile noexcept; 
bool compare exchange _ weak 
BaseType& expected,BaseType new value, 
memory order success order,memory order failure order) noexcept; 


前 置 条 件 


failure_order 不 能 是 std: :memory_order_release 
Bkstd::memory order acq rel. 


结果 

将 expected 与 *this 中 存储 的 值 进 行 按 位 比较 ， 并 且 当 相等 时 将 new_value 
存储 在 *this 中 。 如 果 两 个 值 不 相等 或 是 更 新 不 能 原子 级 进行 ， 就 将 expected 更 
新 为 读 取 到 的 值 。 

返回 


如 果 *this 中 存在 的 值 与 expected 相 等 且 new_value 成 功 存储 在 *this 中 ， 返 
回 true， 否 则 false。 


引发 
无 。 


注 “ 三 参数 的 重 载 与 带 有 success_order==order 和 
failure_order==order 的 四 参数 重 载 是 等 效 的 ， 除 非 order 
是 std: :memory_order_acq_relififailure order 
是 std: :memory_ order _acquire， 或 者 order 
是 std: :memory_order_releaseliifailure order 
是 std: :memory_order_relaxed. 


注 “ 如 果 结 果 为 true， 这 就 是 对 包括 *this 的 内 存 地 址 的 原子 
读 -修改 - 写 操作 ， 带 有 内 存 顺 序 success_order; 否则 ， 它 就 是 对 包 
括 *this 的 内 存 地 址 的 载 入 操作 ， 带 有 内 存 顺 序 failure_order。 


std::atomic_compare_exchange_weak 非 成 员 函 数 


将 值 与 一 个 期 望 值 进 行 比较 ， 并 且 如 果 两 个 值 相等 ， 就 存储 新 的 值 。 如 果 两 
个 值 不 相等 ， 就 用 读 取 到 的 值 更 新 期 望 值 。 


声明 


template<typename BaseType> 

bool atomic_compare_exchange_weak ( 
volatile atomic<BaseType>* p,BaseType * old value,BaseType new value) 
noexcept ; 

template<typename BaseType> 

bool atomic_compare_exchange_weak ( 
atomic«BaseType»* p,BaseType * old value,BaseType new value) noexcept; 


结果 
return p->compare exchange weak(*old value,new value); 
std::atomic compare exchange weakz4F Jk i PK Zt 


将 值 与 一 个 期 望 值 进 行 比较 ， 并 且 如 果 两 个 值 相等 ， 就 存储 新 的 值 。 如 果 两 
个 值 不 相等 ， 就 用 读 取 到 的 值 更 新 期 望 值 。 


声明 


template<typename BaseType> 

bool atomic_compare_exchange_weak_explicit { 
volatile atomic«BaseType»* p,BaseType * old value, 
BaseType new value, memory order success order, 
memory order failure order) noexcept; 

template«typename BaseType> 

bool atomic compare exchange weak explicit(í 
atomic«BaseType»* p,BaseType * old value, 
BaseType new value, memory order success order, 
memory order failure order) noexcept; 


+ 
zh 


return p-»compare exchange weak ( 
*old value,new value,success order,failure order); 


D.3.9 _ std::atomic 模 板 的 特 化 

std: :atomic 类 模板 的 特 化 提供 给 整 型 和 指针 类 型 。 对 于 整 型 ， 这 些 特 化 在 
主 模 板 提供 的 操作 之 外 ， 又 额外 提供 了 原子 级 的 加 、 减 和 按 位 操作 。 对 于 指针 次 
型 ， 这 一 特 化 在 主 模板 提供 的 操作 之 外 又 额外 提供 了 原子 级 的 指针 算数 运算 。 


为 下 面 的 整 型 提供 了 特 化 : 


std: :atomic<bool> 

std: :atomic<char> 

std: :atomic<signed char> 
std::atomic<unsigned char> 
std: :atomic<short> 

std: :atomic<unsigned short> 
std: :atomic<int> 

std: :atomic<unsigned> 

std: :atomic<long> 

std: :atomic<unsigned long> 
std::atomic<long long> 

std: :atomic<unsigned long long» 
std: :atomic<wchar_ t» 
std::atomic«charl6 t» 
std::atomic«char32 t5 


以 及 对 所 有 类 型 T 的 std: :atomic«T*». 


D.3.10 std::atomic«integral-type^ 4 [4 


std: :atomic 类 模板 的 std: :atomic<integral-type> 特 化 为 每 一 个 基本 的 
整 型 提供 了 原子 整 型 数据 类 型 ， 同 时 带 有 一 整套 的 操作 。 


下 面 的 描述 应 用 于 这 些 std: :atomic<> 类 模板 的 特 化。 


std: :atomic<char> 

std: :atomic<signed char» 
std::atomic<unsigned char> 
std::atomic<short> 

std: :atomic<unsigned short> 
std: :atomic<int> 

std: :atomic<unsigned> 

std: :atomic<long> 

std: :atomic<unsigned long> 
std: :atomic<long long> 

std: :atomic<unsigned long long» 
std: :atomic<wchar_ t» 
std::atomic«charl6 t» 
std::atomic«char32 七 > 


这 些 特 化 的 实例 不 是 CopyConstructible 和 CopyAssignable 的 ， 因 为 这 些 
操作 都 不 能 作为 一 个 单一 原子 操作 来 进行 。 


template<> 
struct atomic<integral-type> 


{ 


atomic() noexcept default; 
constexpr atomic (integral-type) 


noexcept ; 


bool operator=(integral-type) volatile noexcept; 


atomic (const atomic&) delete; 
atomic& operator= (const atomic& 


atomic& operator= (const atomic&) volatile 


) 


delete; 


delete; 


bool is_lock_free() const volatile noexcept; 
bool is_lock_free() const noexcept; 


void store(integral-type,memory order 


volatile noexcept; 


void store(integral-type,memory order 


integral-type load(memory order 
const volatile noexcept; 
integral-type load(memory order 
integral-type exchange( 
integral-type,memory order 
volatile noexcept; 
integral-type exchange( 
integral-type,memory order 


bool compare exchange strong( 


memory order seq cst) 


= memory order seg cst) noexcept; 
memory order seq cst) 
memory order seq cst) const noexcept; 


memory order seq cst) 


memory order seq cst) noexcept; 


integral-type & old value,integral-type new value, 


memory order order 
bool compare exchange strong( 


memory order seq cst) volatile noexcept; 


integral-type & old value,integral-type new value, 


memory order order 
bool compare exchange strong( 


integral-type & old value,integral-type 
memory order success order,memory order 


volatile noexcept; 
bool compare exchange strong( 


integral-type & old value,integral-type 
memory order success order,memory order 


bool compare exchange weak( 


integral-type & old value,integral-type 
memory order seq cst) volatile noexcept; 


memory order order 
bool compare exchange weak( 


memory order seq cst) noexcept; 


new value, 
failure order) 


new value, 
failure order) noexcept; 


new value, 


integral-type & old value,integral-type new value, 


memory order order 
bool compare exchange weak(í 


memory order seq cst) noexcept; 


integral-type & old value,integral-type new value, 
memory order success order,memory order failure order) 


volatile noexcept; 
bool compare exchange weak ( 


integral-type & old value,integral-type new value, 


memory order success order,memory order failure order) 


noexcept; 


operator integral-type() const 
operator integral-type() const 


volatile noexcept; 
noexcept; 


integral-type fetch add( 
integral-type,memory order - 
volatile noexcept; 
integral-type fetch add( 
integral-type,memory order 
integral-type fetch sub( 
integral-type,memory order 
volatile noexcept; 
integral-type fetch sub( 
integral-type,memory order 
integral-type fetch and( 
integral-type,memory order - 
volatile noexcept; 
integral-type fetch and( 
integral-type,memory order - 
integral-type fetch or( 
integral-type,memory order - 
volatile noexcept; 
integral-type fetch or( 
integral-type,memory order - 
integral-type fetch xor( 
integral-type,memory order 
volatile noexcept; 
integral-type fetch xor( 
integral-type,memory order 


memory order seq cst) 


memory order seq cst) noexcept; 


memory order seq cst) 


memory order seq cst) noexcept; 


memory order seq cst) 


memory order seq cst) noexcept; 


memory order seq cst) 


memory order seq cst) noexcept; 


memory order seq cst) 


memory order seq cst) noexcept; 


integral-type 
integral-type 
integral-type 
integral-type 
integral-type 
integral-type 
integral-type 
integral-type 


operator++{) volatile noexcept; 
operator++{) noexcept; 

operator++ {int} volatile noexcept; 
operator-««(int) noexcept; 
operator--() volatile noexcept; 
operator--() noexcept; 
operator--(int) volatile noexcept; 
operator--(int) noexcept; 


hs 

bool 
bool 
void 
void 


integral-type 


operator«-(integral-type) 


volatile noexcept; 


integral-type operator+={integral-type) noexcept; 
integral-type operator--(integral-type) volatile noexcept; 
integral-type operator-=({integral-type) noexcept; 
integral-type operator&s(integral-type) volatile noexcept; 
integral-type operator&-(integral-type) noexcept; 
integral-type operator|=(integral-type) volatile noexcept; 
integral-type operator|=(integral-type) noexcept; 
integral-type operator^-(integral-type) volatile noexcept; 
integral-type operator^-(integral-type) noexcept; 


atomic is lock free(volatile const atomic«integral-type»*) noexcept; 

atomic is lock free(const atomic<integral-type>*) noexcept; 

atomic init(volatile atomic<integral-type>*,integral-type) noexcept; 

atomic init(atomic«integral-type»*,integral-type) noexcept; 

integral-type atomic exchange( 
volatile atomic«integral-type»*,integral-type) noexcept; 

integral-type atomic exchange( 


atomic«integral-type»*,integral-type) 


noexcept; 


integral-type atomic exchange explicit ( 

volatile atomic«integral-type»*,integral-type, memory order) noexcept; 
integral-type atomic exchange explicit( 

atomiccintegral-type»*,integral-type, memory order) noexcept; 
void atomic store(volatile atomic«integral-type»*,integral-type) noexcept; 
void atomic store(atomiceintegral-type»*,integral-type) noexcept; 
void atomic store explicit( 

volatile atomic«integral-type»*,integral-type, memory order) noexcept; 
void atomic store explicit( 

atomic«integral-type»*,integral-type, memory order) noexcept; 
integral-type atomic load(volatile const atomic<integral-type>*) noexcept; 
integral-type atomic load(const atomic«integral-type»*) noexcept; 
integral-type atomic load explicit( 

volatile const atomic«integral-type»*,memory order) noexcept; 
integral-type atomic load explicit( 

const atomic«integral-type»*,memory order) noexcept; 
bool atomic compare exchange strong( 

volatile atomic<integral-type>*, 

integral-type * old value,integral-type new value) noexcept; 
bool atomic compare exchange strong( 

atomic«integral-type»*, 

integral-type * old value,integral-type new value) noexcept; 
bool atomic compare exchange strong explicit ( 

volatile atomic«integral-type»*, 

integral-type * old value,integral-type new value, 

memory order success order,memory order failure order) noexcept; 
bool atomic compare exchange strong explicit( 

atomic«integral-type»*, 

integral-type * old value,integral-type new value, 

memory order success order,memory order failure order) noexcept; 
bool atomic compare exchange weak! 

volatile atomic«integral-type»*, 

integral-type * old value,integral-type new value) noexcept; 
bool atomic compare exchange weak( 

atomic<integral-type>*, 

integral-type * old value, integral-type new value) noexcept; 
bool atomic compare exchange weak explicit( 

volatile atomic«integral-type»*, 

integral-type * old value,integral-type new value, 

memory order success order,memory order failure order) noexcept; 
bool atomic compare exchange weak explicit( 

atomic<integral-type>*, 

integral-type * old value,integral-type new value, 

memory order success order,memory order failure order) noexcept; 


integral-type atomic fetch add( 
volatile atomic<integral-type>*,integral-type) noexcept; 
integral-type atomic fetch add( 
atomic<integral-type>*,integral-type) noexcept; 
integral-type atomic fetch add explicit( 
volatile atomic«integral-type»*,integral-type, memory order) noexcept; 
integral-type atomic fetch add explicit( 
atomic«integral-type»*,integral-type, memory order) noexcept; 
integral-type atomic fetch sub( 
volatile atomic«integral-type»*,integral-type) noexcept; 


integral-type atomic fetch sub( 
atomic«integral-type»*,integral-type) noexcept; 
integral-type atomic fetch sub explicit( 
volatile atomic«integral-type»*,integral-type, memory order) noexcept; 
integral-type atomic fetch sub explicit( 
atomic«integral-type»*,integral-type, memory order) noexcept; 
integral-type atomic fetch and( 
volatile atomic«integral-type»*,integral-type) noexcept; 
integral-type atomic fetch and( 
atomic«integral-type»*,integral-type) noexcept; 
integral-type atomic fetch and explicit( 
volatile atomic«integral-type»*,integral-type, memory order) noexcept; 
integral-type atomic fetch and explicit( 
atomic«integral-type»*,integral-type, memory order) noexcept; 
integral-type atomic fetch or(í( 
volatile atomic«integral-type»*,integral-type) noexcept; 
integral-type atomic fetch or ( 
atomic«integral-type»*,integral-type) noexcept; 
integral-type atomic fetch or explicit( 
volatile atomic«integral-type»*,integral-type, memory order) noexcept; 
integral-type atomic fetch or explicit( 
atomic«integral-type»*,integral-type, memory order) noexcept; 
integral-type atomic fetch xor( 
volatile atomic«integral-type»*,integral-type) noexcept; 
integral-type atomic fetch xor( 
atomic«integral-type»*,integral-type) noexcept; 
integral-type atomic fetch xor explicit( 
volatile atomic«integral-type»*,integral-type, memory order) noexcept; 
integral-type atomic fetch xor explicit( 
atomic«integral-type»*,integral-type, memory order) noexcept; 


在 主 模板 中 同时 提供 的 那些 操作 《参见 D.3.8) 拥有 同样 的 语义 。 
std::atomic<integral-type>::fetch_add 成 员 函 数 
载 入 一 个 值 ， 并 且 将 其 蔡 换 为 它 的 值 与 提供 的 i 的 值 之 和 。 


声明 


integral-type fetch add( 
integral-type i,memory order order 
volatile noexcept; 

integral-type fetch add( 
integral-type i,memory order order 


memory order seq cst) 


ll 


memory order seq cst) noexcept; 


E 
zh 


获取 *this 现 存 值 并 且 将 旧 值 +i 存 储 在 *this 中 。 


返回 
刚刚 在 存储 之 前 的 *this 值 。 
引发 
无 
注 这 是 一 项 对 于 包括 *this 的 内 存 地 址 的 原子 的 读 -修改 - 写 操 
作 。 


std::atomic fetch_add 非 成 员 函 数 


从 atomicxintegral-type> 实 例 读 取 值 ， 并 将 其 蔡 换 为 该 值 加 上 提供 的 i 
值 。 


声明 
integral-type atomic fetch add( 
volatile atomic«integral-type»* p, integral-type i) noexcept; 


integral-type atomic fetch add( 
atomic«integral-type»* p, integral-type i) noexcept; 


结果 
return p->fetch addii); 
std::atomic_fetch_add_explicit 非 成 员 函 数 


从 atomicxintegral-type> 实 例 读 取 值 ， 并 将 其 蔡 换 为 该 值 加 上 提供 的 i 
值 。 


声明 


integral-type atomic_fetch_add_explicit { 
volatile atomic<integral-type>* p, integral-type i, 
memory order order) noexcept; 
integral-type atomic fetch add explicit( 
atomic«integral-type»* p, integral-type i, memory order order) 
noexcept ; 


结果 
return p->fetch add(i,order) ; 
std::atomic<integral-type>::fetch_sub 成 员 函 数 

载 入 一 个 值 ， 并 且 将 其 伏 换 为 它 的 值 减 去 所 提供 的 i 的 值 。 


声明 


integral-type fetch sub( 
integral-type i,memory order order = memory order seq cst) 
volatile noexcept; 
integral-type fetch sub( 
integral-type i,memory order order - memory order seq cst) noexcept; 


bs 
获取 sthis 现 存 值 并 且 将 旧 值 -i 存 储 在 *this 中 。 
返回 
刚刚 在 存储 之 前 的 *this 值 。 
引发 
X 
注 这 是 一 项 对 于 包括 *this 的 内 存 地 址 的 原子 级 的 读 -修改 - 写 
操作 。 


std::atomic_fetch_sub 非 成 员 函 数 
从 atomic<integral-type> 实 例 读 取 值 ， 并 将 其 替换 为 该 值 减 去 提供 的 


ffi. 
声明 


integral-type atomic fetch sub( 

volatile atomic«integral-type»* p, integral-type i) noexcept; 
integral-type atomic fetch sub( 

atomic«integral-type»* p, integral-type i) noexcept; 


结 
return p->fetch sub (i); 
std::atomic_fetch_sub_explicit 非 成 员 函 数 


从 atomic<integral-type> 实 例 读 取 值 ， 并 将 其 蔡 换 为 该 值 减 去 提供 的 
值 。 


声明 


integral-type atomic fetch sub explicit( 
volatile atomiceinregral-types* p, integral-type i, 
memory order order) noexcept; 
integral-type atomic fetch sub explicit( 
atomic«integral-type»* p, integral-type i, memory order order) 
noexcept ; 


结果 
return p->fetch subli,order}, 
std::atomic<integral-type>::fetch_and 成 员 函 数 

载 入 一 个 值 ， 并 将 其 蔡 换 为 它 的 值 与 所 提供 的 i 值 按 位 与 的 结 


声明 


integral-type fetch and( 
integral-type i,memory order order - memory order seq cst) 
volatile noexcept; 
integral-type fetch and( 
integral-type i,memory order order - memory order seq cst) noexcept; 


+ 
zh 


获取 *this 现 存 的 值 ， 并 将 旧 值 &i 存 储 在 *this 中 。 


返回 

刚刚 在 存储 之 前 的 *this 值 。 
引发 

无 


注 ” 这 是 一 项 对 于 包括 *this 的 内 存 地 址 的 原子 级 的 读 -修改 - 写 
操作 。 


std::atomic fetch_and 非 成 员 函 数 


从 atomic<integral-type> 实 例 读 取 值 ， 并 将 其 蔡 换 为 它 的 值 与 所 提供 的 1 
值 按 位 与 的 结果 。 


声明 


integral-type atomic fetch and( 

volatile atomic«integral-type»* p, integral-type i) noexcept; 
integral-type atomic fetch and( 

atomic«integral-type»* p, integral-type i) noexcept; 


结果 
return p->fetch and{i); 
std::atomic_fetch_and_explicit 非 成 员 函 数 


从 atomic<integral-type> 实 例 读 取 值 ， 并 将 其 蔡 换 为 它 的 值 与 所 提供 的 1 
值 按 位 与 的 结果 。 


声明 


integral-type atomic fetch and explicit( 
volatile atomic«integral-type»* p, integral-type i, 
memory order order) noexcept; 
integral-type atomic fetch and explicit( 
atomic«integral-type»* p, integral-type i, memory order order] 
noexcept ; 


结果 
return p->fetch and{i,order); 
std::atomic<integral-type>::fetch_or jk 5i RK AL 
MAME, FOREN CAES Pe EY Le AR 
声明 
integral-type fetch or( 
integral-type i,memory order order - memory order seq cst) 
volatile noexcept; 


integral-type fetch or( 
integral-type i,memory order order - memory order seq cst) noexcept; 


结果 
获取 *this 现 存 的 值 ， 并 将 旧 值 |i 存 储 在 *this 中 。 
返回 
刚刚 在 存储 之 前 的 *this 值 。 
引发 
无 
注 这 是 一 项 对 于 包括 *this 的 内 存 地 址 的 原子 级 的 读 -修改 - 写 
操作 。 


std::atomic fetch_or 非 成 员 函 数 


从 atomic<integral-type> 实 例 读 取 值 ， 并 将 其 蔡 换 为 它 的 值 与 所 提供 的 1 
值 按 位 或 的 结果 。 


声明 


integral-type atomic_fetch_or ( 


volatile atomic«integral-type»* p, integrai-type i) noexcept; 


integral-type atomic fetch or( 


atomic«integral-type»* p, integral-type i) noexcept; 


结果 
return p-»fetch or(i); 


std::atomic fetch or explicit4F Hk 5i FK 2X 


从 atomic<integral-type> 实 例 读 取 值 ， 并 将 其 蔡 换 为 它 的 值 与 所 提供 的 1 


值 按 位 或 的 结果 。 


声明 


integral-type atomic fetch or explicit( 
volatile atomic«integral-type»* p, integral-type i, 


memory order order) noexcept; 


integral-type atomic fetch or explicit( 
atoniceintegral-type»* p, integral-type i, memory order order) 


noexcept; 
结果 


return p-sfstch or{i,0rder}; 


std::atomic<integral-type>::fetch_xor 成 员 函 数 


载 入 一 个 值 ， 并 将 其 丛 换 为 它 的 值 与 所 提供 的 i 值 按 位 异 或 的 结 


声明 


integral-type fetch_xor ( 
integral-type 1,memory_order order 
volatile noexcept; 

integral-type fetch_xor ( 
integral-type i,memory_order order 


ar 
zh 


memory order seq cst) 


memory order seq cst) noexcept; 


获取 *this 现 存 的 值 ， 并 将 旧 值 入 存 储 在 *this 中 。 


返回 
刚刚 在 存储 之 前 的 *this 值 。 


引发 


注 ” 这 是 一 项 对 于 包括 *this 的 内 存 地 址 的 原子 级 的 读 -修改 - 写 
操作 。 


std::atomic_fetch_or 非 成 员 函 数 

从 atomic<integral-type> 实 例 读 取 值 ， 并 将 其 蔡 换 为 它 的 值 与 所 提供 的 1 
值 按 位 异 或 的 结果 。 

声明 


integral-type atomic_fetch_xor{ 

volatile atomic<integral-type>* p, integral-type i) noexcept; 
integral-type atomic fetch xor( 

atomic«integral-type»* p, integral-type i) noexcept; 


结 
return p->fetch xor (i); 
std::atomic_fetch_or_explicit 非 成 员 函 数 

从 atomic<integral-type> 实 例 读 取 值 ， 并 将 其 蔡 换 为 它 的 值 与 所 提供 的 
值 按 位 异 或 的 结果 。 

声明 


integral-type atomic_fetch_xor_explicit { 
volatile atomic«integral-type»* p, integral-type i, 
memory order order) noexcept; 
integral-type atomic fetch xor explicit( 
atomic«integral-type»* p, integral-type i, memory order order) 
noexcept; 


+ 
结 


return p->fetch xorl(i,order}, 


Ned 


std::atomic<integral-type>::operator++ fil & E] 3235 $34] 
递增 存储 在 *this 中 的 值 并 返回 新 值 。 
声明 


integral-type operator++() volatile noexcept; 
integral-type operator++() noexcept; 


结果 
return this->fetch add(1) + 1; 
std::atomic<integral-type>::operator++ 后 置 自 增 运算 符 

递增 存储 在 *this 中 的 值 并 返回 旧 值 。 

声明 
integral-type operator++(int) volatile noexcept; 
integral-type operator++(int) noexcept; 


结果 
return this->fetch add({1); 
std::atomic<integral-type>::operator-- 前 置 自 增 运 算 符 


递增 存储 在 *this 中 的 值 并 返回 新 值 。 


声明 
integral-type operator--() volatile noexcept; 
integral-type operator--() noexcept; 

结果 


return Ehis-sietch 30541) = 15 
std::atomic«integral-type»::operator--/ri & His $51 
递增 存储 在 *this 中 的 值 并 返回 旧 值 。 


声明 


integral-type operator--(int) volatile noexcept; 
integral-type operator--(int) noexcept; 


+ 
zh 


return this->fetch sub (1); 


std::atomic<integral-type>::operator+= 复 合 赋值 运算 符 
将 所 给 的 值 加 到 *this 中 存储 的 值 上 ， 并 返回 新 值 。 
声明 


integral-type operator+=(integral-type i) volatile noexcept; 
integral-type operator+=(integral-type i) noexcept; 


ard 
结 


return this->fetch add(i) + i; 


std::atomic<integral-type>::operator-= 复 合 赋值 运算 符 
从 *this 中 存储 的 值 减 去 所 给 的 值 ， 并 返回 新 值 。 
声明 


integral-type operator--(integral-type i) volatile noexcept; 
integral-type operator--(integral-type i) noexcept; 


+ 
结 


return this->fetch sub(i,std::memory order seq cst) - i; 


std::atomic<integral-type>::operator&= 复 合 赋值 运算 符 


将 *this 中 存储 的 值 蔡 换 为 所 给 值 和 存储 在 *this 中 的 值 按 位 与 的 结果 ， 并 
返回 新 值 。 


声明 


integral-type operator&-(integral-type i) volatile noexcept; 
integral-type operator&-(integral-type i) noexcept; 


结果 


return this->fetch and(i) & i; 


std::atomic<integral-type>::operator|= 复 合 赋值 运算 符 


将 *this 中 存储 的 值 蔡 换 为 所 给 值 和 存储 在 *this 中 的 值 近 位 或 的 结果 ， 并 
返回 新 值 。 


声明 


integral-type operator|=(integral-type i) volatile noexcept; 
integral-type operator|-(integral-type i) noexcept; 


E 
zh 


return this->fetch or(i,std::memory order seq cst) | i; 


std::atomic<integral-type>::operator 人 ^= 复 合 赋值 运算 符 


将 *this 中 存储 的 值 蔡 换 为 所 给 值 和 存储 在 *this 中 的 值 按 位 异 或 的 结果 ， 
并 返回 新 值 。 


声明 


integral-type operator^-(integral-type i) volatile noexcept; 
integral-type operator^-(integral-type i) noexcept; 


结 
return this-»fetch xor(i,std::memory order seq cst) ^ i; 
D.3.11 std::atomic<T*> 偏 特 化 


std: :atomic 类 模板 的 std: :atomic<T*> 偏 特 化 为 每 一 个 指针 类 型 提供 了 原 
子 数据 类 型 ， 同 时 带 有 一 整套 的 操作 。 


这 些 std: :atomic<T*> 的 实例 不 是 CopyConstructible 和 CopyAssignable 
的 ， 因 为 这 些 操 作 都 不 能 作为 一 个 单一 原子 操作 来 进行 。 


template<typename T> 
struct atomic<T*> 


{ 


atomicí() noexcept = default; 
constexpr atomic(T*) noexcept; 
bool operator-(T*) volatile; 
bool operator=(T*) ; 


atomic(const atomic&) = delete; 
atomic& operator=(const atomic&) = delete; 
atomic& operator=(const atomic&) volatile = delete; 


bool is lock free() const volatile noexcept; 

bool is lock free() const noexcept; 

void store(T*,memory order - memory order seq cst) volatile noexcept; 

void store(T*,memory order - memory order seq cst) noexcept; 

T* load(memory order = memory order seq cst) const volatile noexcept; 

T* load(memory order - memory order seq cst) const noexcept; 

T* exchange(T*,memory order - memory order seq cst) volatile noexcept; 
T* exchange(T*,memory order = memory order seq cst) noexcept; 


bool compare exchange strong( 
T* & old value, T* new value, 
memory order order - memory order seq cst) volatile noexcept; 
bool compare exchange strong(í 
T* & old value, T* new value, 
memory order order - memory order seq cst) noexcept; 
bool compare exchange strong( 
T* & old value, T* new value, 
memory order success order,memory order failure order) 
volatile noexcept; 
bool compare exchange strong( 
T* & old value, T* new value, 
memory order success order,memory order failure order) noexcept; 
bool compare exchange weak( 
T* & old value, T* new value, 
memory order order = memory order seq cst) volatile noexcept; 
bool compare exchange weakí 
T* & old value, T* new value, 
memory order order - memory order seq cst) noexcept; 
bool compare exchange weak(í 
T* & old value, T* new value, 
memory order success order,memory order failure order) 
volatile noexcept; 
bool compare exchange weak(í 
T* & old value, T* new value, 
memory order success order,memory order failure order) noexcept; 


operator T*{) const volatile noexcept; 
operator T*() const noexcept; 


T* fetch add( 

ptrdiff t,memory order 
T* fetch add( 

ptrdiff t,memory order - memory order seq cst) noexcept; 


memory order seq cst) volatile noexcept; 


T* fetch sub( 

ptrdiff t,memory order - memory order seq cst) volatile noexcept; 
T* fetch sub( 

ptrdiff t,memory order - memory order seq cst) noexcept; 


T* operator++() volatile noexcept; 

T* operator++() noexcept; 

T* operator++(int) volatile noexcept; 
T* operator++(int) noexcept; 

T* operator--() volatile noexcept; 

T* operator--() noexcept; 

T* operator--(int) volatile noexcept; 
T* operator--(int) noexcept; 


T* operator«-(ptrdiff t) volatile noexcept; 
T* operator«-(ptrdiff t) noexcept; 
T* operator--(ptrdiff t) volatile noexcept; 
T* operator--(ptrdiff t) noexcept; 


}; 


bool atomic is lock free(volatile const atomic<T*>*) noexcept; 
bool atomic is lock free(const atomic<T*>*) noexcept; 
void atomic init(volatile atomic«T*»*, T*) noexcept; 
void atomic init(atomic«T*»*, T*) noexcept; 
T* atomic exchange(volatile atomic«T*»*, T*) noexcept; 
T* atomic exchange(atomic«T*»*, T*) noexcept; 
T* atomic exchange explicit(volatile atomic<T*>*, T*, memory order) 
noexcept; 
T* atomic exchange explicit(atomic«T*»*, T*, memory order) noexcept; 
void atomic store(volatile atomic<T*>*, T*) noexcept; 
void atomic store(atomic«T*»*, T*) noexcept; 
void atomic store explicit(volatile atomic«T*»*, T*, memory order) 
noexcept; 
void atomic store explicití(atomic«T*»*, T*, memory order) noexcept; 
T* atomic load(volatile const atomic<T*>*) noexcept; 
T* atomic load(const atomic<T*>*) noexcept; 
T* atomic load explicit(volatile const atomic«T*»*, memory order) noexcept; 
T* atomic load explicit(const atomic<T*>*, memory order) noexcept; 
bool atomic compare exchange strong( 
volatile atomic<T*>*,T* * old value,T* new value) noexcept; 
bool atomic compare exchange strong( 
volatile atomic<T*>*,T* * old value,T* new value) noexcept; 
bool atomic compare exchange strong explicit( 
atomic<T*>*,T* * old value,T* new value, 
memory order success order,memory order failure order) noexcept; 
bool atomic compare exchange strong explicit( 
atomic<T*>*,T* * old value,T* new value, 
memory order success order,memory order failure order) noexcept; 
bool atomic compare exchange weak( 
volatile atomic<T*>*,T* * old value,T* new value) noexcept; 
bool atomic compare exchange weak(í 
atomic<T*>*,T* * old value,T* new value) noexcept; 
bool atomic compare exchange weak explicit( 
volatile atomic<T*>*,T* * old value, T* new value, 
memory order success order,memory order failure order) noexcept; 


bool atomic_compare_exchange_weak_explicit ( 
atomic<T*>*,T* * old value, T* new value, 
memory order success order,memory order failure order) noexcept; 


TY atomic fetch add(volatile atomic<T*>*, ptrdiff_t) noexcepty 
T* atomic fetch add(atomic«T*»*, ptrdiff t) noexcept; 
T* atomic fetch add explicit( 

volatile atomic«T*»*, ptrdiff t, memory order) noexcept; 
T* atomic fetch add ‘explicit | 

atomic<T*>*, ptrdiff t, memory order) noexcept; 
T* atomic fetch sub(volatile atomic<T*>*, ptrdiff t) noexcept; 
T* atomic fetch sub(atomic«T*»*, ptrdiff t) noexcept; 
T* atomic fetch sub explieiti 

volatile atomic«T*»*, ptrdiff t, memory order) noexcept; 
Te atomic_fetch_sub_explicit{ 

atomic«T*»*, ptrdiff t, memory order) noexcept; 


在 主 模板 中 同时 提供 的 那些 操作 〈 见 D.3.8) 拥有 同样 的 语义 。 
std::atomic<T*>::fetch_add 成 员 函 数 


载 入 一 个 值 ， 并 且 使 用 标准 指针 算术 规则 将 其 警 换 为 它 的 值 与 所 给 的 i 的 值 
之 和 ， 并 返回 旧 值 。 
声明 
T* fetch_add( 
ptrdiff t i,memory_order order = memory order seq cst) 
volatile noexcept; 


T* fetch add ( 
ptrdiff t i,memory order order = memory order seq cst) noexcept; 


结 

获取 *this 现 存 值 并 且 将 旧 值 +i 存 储 在 *this 中 。 
返回 

刚刚 在 存储 之 前 的 *this 值 。 

引发 

无 


注 ”这 是 一 项 对 于 包括 *this 的 内 存 地 址 的 原子 级 的 读 -修改 - 写 
操作 。 


std::atomic fetch_add 非 成 员 函 数 


从 atomic<T*> 实 例 读 取 值 ， 并 使 用 标准 指针 算术 规则 ， 将 其 葵 换 为 该 值 加 
上 提供 的 i 值 。 


声明 


T* atomic fetch add(volatile atomic<T*>* p, ptrdiff t i) noexcept; 
T* atomic fetch add(atomic«T*»* p, ptrdiff t i) noexcept; 


结 
return p->fetch addi}; 
std::atomic fetch add explicit4E X, i eh BL 


从 atomic<T*> 实 例 读 取 值 ， 并 使 用 标准 指针 算术 规则 ， 将 其 蔡 换 为 该 值 加 
上 提供 的 i 值 。 

声明 
T* atomic fetch add explicit ( 

volatile atomic<T*>* p, ptrdiff t i,memory_order order) noexcept; 


T* atomic fetch add explicit( 
atomic<T*>* p, ptrdiff t i, memory order order) noexcept; 


结果 
return p->fetch addii,order); 
std::atomic<T*>::fetch_sub iK 5i pK A 


载 入 一 个 值 ， 并 且 使 用 标准 指针 算术 规则 将 其 丛 换 为 它 的 值 减 去 所 给 的 i 的 
值 ， 并 返回 旧 值 。 


声明 


T* fetch sub( 
ptrdiff t i,memory order order = memory order seq cst) 
volatile noexcept; 
T* fetch sub( 
ptrdiff t i,memory order order - memory order seq cst) noexcept; 


结果 
获取 *this 现 存 值 并 且 将 旧 值 -i 存储 在 *this 中 。 
返回 
刚刚 在 存储 之 前 的 *this 值 。 
引发 
无 
Hk 这 是 一 项 对 于 包括 *this 的 内 存 地 址 的 原子 级 的 读 - 修 改 - 写 
操作 。 


std::atomic fetch_sub 韭 成 员 函 数 


从 atomic<T*> 实 例 读 取 值 ， 并 且 使 用 标准 指针 算术 规则 ， 将 其 丛 换 为 它 的 
值 减 去 所 给 的 i 的 值 。 


声明 


T* atomic fetch sub (volatile atomic<T*>* p, ptrdiff t i) noexcept; 
T* atomic fetch sub(atomic<T*>* p, ptrdiff t i) noexcept; 


结果 
return p->fetch subi(i); 
std::atomic fetch sub, explicit3E sk à eh Zt 


从 atomic<T*> 实 例 读 取 值 ， 并 且 使 用 标准 指针 算术 规则 ， 将 其 丛 换 为 它 的 
值 减 去 所 给 的 i 的 值 。 


声明 


T* atomic fetch sub explicit( 
volatile atomic<T*>* p, ptrdiff t i,memory order order) noexcept; 


T* atomic fetch sub explicit( 
atomic«T*»* p, ptrdiff t i, memory order order) noexcept; 


结果 
return p->fetch subli,order}, 
std::atomic<T*>::operator++ 前 置 自 增 运算 符 
使 用 标准 指针 算术 规则 递增 存储 在 *this 中 的 值 并 返回 新 值 。 
声明 


T* operator++() volatile noexcept; 
T* operator++() noexcept; 


2 
return this->fetch add(i) + i; 
std::atomic<T*>::operator++ 后 置 自 增 运算 符 
使 用 标准 指针 算术 规则 递增 存储 在 *this 中 的 值 并 返回 旧 值 。 
声明 


T* operator++(int) volatile noexcept; 
T* operator++(int) noexcept; 


结果 
return this->fetch add{1),， 
std::atomic<T*>::operator-- 前 置 自 增 运算 符 
使 用 标准 指针 算术 规则 递增 存储 在 *this 中 的 值 并 返回 新 值 。 
声明 


T* operator--() volatile noexcept : 
T* operator--() noexcept; 


结 
return this->fetch add(i) + i; 
std::atomic<T*>::operator-- 后 置 白 增 运 算 符 


使 用 标准 指针 算术 规则 递增 存储 在 *this 中 的 值 并 返回 旧 值 。 


声明 
T* operator--(int) volatile noexcept; 
T* operator--(int) noexcept; 

结果 


return this->fetch subil); 


std::atomic<T*>::operator+= 复 合 赋 值 运算 符 
使 用 标准 指针 算术 规则 将 所 给 的 值 加 到 *this 中 存储 的 值 上 ， 并 返回 新 值 。 
声明 


T* operators«-(ptrdiff t i) volatile noexcept; 
I* operators«-(ptradiff t 1) noexcept; 


结果 


return this->fetch add(i) + i; 


std::atomic<T*>::operator-= 复 合 赋值 运算 符 
使 用 标准 指针 算术 规则 从 *this 中 存储 的 值 减 去 所 给 的 值 ， 并 返回 新 值 。 
声明 


I* Operator-=(ptrdiff t i) volatile noexcept; 
T* operator--(ptrdiff t i) noexcept; 


+ 
zh 


return this-»fetch sub(i) - i; 


D.4 <future> 头 文件 


<future> 头 文件 提供 了 一 些 工 具 ， 用 来 处 理 来 自 于 可 能 执行 在 妨 一 个 线程 上 
的 操作 的 异步 结果 。 


头 文件 内 容 


namespace std 


{ 


enum class future status { 
ready, timeout, deferred y; 


enum class future erre 


{ 


broken_promise, 

future already retrieved, 
promise already satisfied, 
no state 


ls 
class future error; 


const error category& future category(); 


error code makes error ‘code (future errc e); 
error condition make error condition(future errc e); 


template«typename ResultType> 
class future; 


template«typename ResultType- 
class shared future; 


template<typename ResultType> 
class promise; 


template<typename FunctionSignature> 
class packaged task; // no definition provided 


template<typename ResultType,typename ... Args> 
class packaged task«ResultType (Args...)»; 


enum class launch { 
async, deferred 


E 


template<typename FunctionType,typename ... Args> 
future<result_of<FunctionType (Args...)>::type> 
async(FunctionType&& func,Args&& ... args); 


template<typename FunctionType,typename ... Args» 
future<result_of<FunctionType (Args...)»::type» 
async (std: : launch policy,FunctionType&& func,Args&& ... args); 


D.4.1 std::future 类 模板 


std: :future 类 模板 提供 了 从 另 一 线程 等 竺 异步 结 果 的 方法 ， 
Ejstd::promise. std::packaged _ task 类 模板 和 std: :async 隙 数 模板 联合 使 
用 ， 可 以 用 来 提供 此 异步 结果 。 在 任意 时 刻 ， 只 有 一 个 std: :future 实 例 引 用 所 
有 给 定 的 异步 结果 。 


std: :future 的 实例 是 MoveConstructible 和 MoveAssignable 的 ， 但 不 
是 CopyConstructible 或 CopyAssignable 的 。 
template<typename ResultType> 
class future 
{ 
public: 
future() noexcept; 
future(future&&) noexcept; 


future& operator-(future&&) noexcept; 
-future(); 


future (future const&) = delete; 
future& operator-(future const&) - delete; 


shared future«ResultType» share(); 
bool valid() const noexcept; 

see description get(); 

void wait(); 


template«typename Rep,typename Period» 
future status wait for( 
std::chrono::duration«Rep,Period» const& relative time); 


template<typename Clock,typename Duration» 
future status wait until( 
std::chrono::time point«Clock,Duration» const& absolute time); 


std::future 默 认 构 造 函数 
构造 与 异步 结果 没有 关联 的 std: :future 对 象 。 
声明 
future() noexcept; 
结果 
构造 一 个 新 的 std: :future 实 例 。 
后 置 条 件 
valid() 返 回 false。 
引发 
无 。 
std::future 移 动 构造 函数 


从 另 一 个 std: :future 对 象 中 构造 std: :future 对 象 ， 将 与 男 
一 std: :future 对象 关 联 的 异步 结果 的 所 有 权 转 移 到 新 构造 的 实例 中 。 


声明 
future (future&& other) noexcept; 

结果 

从 other 移动 构造 一 个 新 的 std: :future 实 例 。 

后 置 条 件 


在 调用 此 构造 函数 之 前 与 other 关联 的 异步 结果 ， 现 在 被 关联 至 新 构造 的 
std: :future 对象。other 没 有 关联 异步 结果 。this->valid() 的 返回 值 与 在 调 
用 这 一 构造 函数 之 前 other .valid() 会 返回 的 值 相同 。other .valid() 返 回 
false. 


引发 
无 。 


std::future 移 动 赋值 运算 符 


将 于 一 个 std: :future 对 象 关联 的 异步 结果 的 所 有 权 转 移 到 另 一 个 对 象 中 。 

声明 
Future (future&& other) noexcept; 

结果 

在 std: :future 实 例 间 转移 异步 状态 的 所 有 权 。 

后 置 条 件 

在 调用 此 构造 函数 之 前 与 other 关联 的 异步 结果 ， 现 在 被 关联 至 新 构造 的 
std: :future 对象。other 没 有 关联 异步 结果 。 在 调用 前 关联 至 *this 的 异步 状 
S CURA) 的 所 有 权 被 释放 ， 如 果 这 是 最 后 一 个 引用 则 状态 被 销毁 。this- 
>valid() 的 返回 值 与 在 调用 这 一 构造 函数 之 前 other .valid() 会 返回 的 值 相 
同 。other.valid() 返 回 false。 

引发 

Jug 
std::future 析 构 函 数 

销毁 std: :future 对象。 

声明 
~future (); 

结 


销毁 *this。 如 果 这 是 对 关联 至 *this 的 异步 结果 (CRA) 的 最 后 一 个 引 
用 ， 那 么 销毁 该 异步 结果 。 


引发 
无 o 
std::future::shareJ 5i PKI AX 


构造 新 的 std: :shared_future 实 例 ， 并 将 关联 至 *this 的 异步 结果 的 所 有 
权 转 移 至 这 个 新 构造 的 std: :shared_future 实 例 。 


声明 


shared future<ResultType> share(); 
zh 
如 同 shared_future<ResultType>(std: :move(*this)). 


后 置 条 件 


如 果 有 调用 share()， 那 么 在 调用 它 之 前 关联 至 *this 的 异 
联 至 新 构造 的 std: : shared_future 实 例 。this->valid() 返 回 false。 


步 结 果 ， 现 在 关 


引发 
Tee 
std::future::valid sk i PK BL 
检查 std: :future 实 例 是 否 关 联 至 异步 结果 。 
声明 
bool valid() 
返回 
如 果 *this 已 关联 至 异步 结果 ， 返 回 true， 否 则 返回 false。 


const noexcept; 


引发 

Ze 
std::future::wait 成 员 函 数 

如 果 关 联 至 *this 的 状态 包含 延迟 函数 ， 调 用 此 延 玉 函数。 否则 ， 一 直 等 待 
到 关联 至 std: :future 实 例 的 异步 结果 就 绪 。 


声明 
void waití); 

前 置 条 件 

this->valid() 应 返回 true。 


结果 


如 果 关 联 状 态 包 合 延 迟 函 数 ， 调 用 此 延迟 函数 并 存储 返回 值 或 将 引发 的 异常 
存储 为 异步 结果 。 否 则 ， 阻 突 直 到 关联 至 *this 的 异步 结果 就 绪 。 


引发 
无 o 
std::future::wait for 成 员 函 数 


一 直 等 到 关联 至 std: :future 实 例 的 异步 结果 就 绪 ， 或 者 直到 指定 的 时 间 段 


wiz: 
声明 
template<typename Rep, typename Period» 


future status wait for ( 
std:: chrono: :duration<Rep, Period> const& relative time); 


前 置 条 件 

this->valid() 应 返回 true。 

结果 

如 果 关 联 至 *this 的 异步 结果 包含 延迟 函数 ， 它 是 从 对 std:async 的 调用 发 
起 的 且 尚 未 开始 执行 ， 则 立即 返回 不 进行 阻塞 。 否 则 一 直 阻 塞 到 关联 至 *this 的 
异步 结果 就 绪 ， 或 者 由 relative _ time 指定 的 时 间 段 逝去 。 

返回 

如 果 关 联 至 *this 的 异步 调用 包含 延迟 函数 ， 它 是 从 对 std:async 的 调用 发 
起 的 且 尚 未 开始 执行 ， 返 回 std: :future_status: :deferred， 如 果 关 联 至 


*this 的 异步 结果 就 绕 ， 返 回 std: :future_status: :ready， 如 果 
由 relative_time 指 定 的 时 间 段 逝去 则 返回 std: : future_status: :timeout。 


TE “线程 可 能 会 比 指定 的 时 间 段 阻塞 得 更 入。 如果 可 能 ， 逝 去 
时 间 应 由 匀速 时 钟 决定 。 


引发 


Ud 
std::future::wait untilJX, 53 PK ZA 

一 直 等 到 关联 至 std: :future 实 例 的 异步 结果 就 绪 ， 或 者 到 达 一 个 指定 的 时 
间 。 

声明 


template<typename Clock,typename Duration> 
future status wait_until ( 
std::chrono: :time_point<Clock,Duration> const& absolute time) ; 


前 置 条 件 
this->valid() 应 返回 true。 
结果 


如 果 关 联 至 *this 的 异步 结果 包含 延迟 函数 ， 它 是 从 对 std:async 的 调用 发 
起 的 且 尚 未 开始 执行 ， 则 立即 返回 不 进行 阻塞 。 人 否则 一 直 阻 塞 到 关联 至 *this 的 
异步 结果 就 绪 ， 或 者 Clock: :now() 返 回 一 个 等 于 或 晚 于 absolute_ time 的 时 
间 。 


返回 


如 果 关 联 至 *this 的 异步 调用 包含 延迟 函数 ， 它 是 从 对 std:async 的 调用 发 
起 的 且 尚 未 开始 执行 ， 返 回 std: :future_status::deferred， 如 果 关 联 至 
*this 的 异步 结果 就 绕 ， 返 回 std: :future_status: :ready， 如 果 
Clock: :now() 返 回 一 个 等 于 或 晚 于 absolute_time 的 时 间 则 返回 
std::future_status: : timeout. 


注 不 能 保证 调用 线程 会 被 阻塞 多 久 ， 只 有 当 函 数 返回 
std::future status::timeout， 且 Clock: :now() 返 回 一 个 等 于 
或 晚 于 absolute_time 的 时 间 的 时 候 ， 线 程 才 会 被 解锁 。 


引发 


std::future::getJ 5i PR ži 


如 果 关 联 着 的 状态 包含 一 个 来 自 对 std: :async 调 用 的 延迟 函数 ， 调 用 该 函 
数 并 返回 值 ， 否 则 ， 一 直 等 待 到 关联 至 std: :future 实 例 的 异步 结果 就 绪 ， 接 着 
返回 存储 的 值 或 引发 存储 的 异常 。 

声明 
void future<void>::get () ; 

R& future<R&>::get (); 
R futurecR»::getí); 


前 置 条 件 


this->valid() 应 返回 true。 


ard 
zh 


如 果 关 联 至 *this 的 状态 包含 延迟 函数 ， 调 用 该 延迟 函数 并 且 返 回 结果 或 者 
传播 任何 已 引发 的 异常 。 


人 否则， 一 直 阻 豆 到 关联 至 *this 的 异步 结果 束 绪 。 如 果 结 果 是 存储 的 异常 ， 
引发 该 异常 。 否 则 ， 返 回 存储 的 值 。 


返回 

如 果 关 联 的 状态 包含 延迟 函数 ， 返 回 该 函数 调用 的 结果 。 人 否则 ， 如 果 
ResultType 是 void， 调 用 正常 返回 。 如 果 ResultType 是 某 些 类 型 R 的 R&， 返 回 
存储 的 引用 。 和 否则 ， 返 回 存储 的 值 。 

引发 

由 延迟 函数 引发 的 异常 ， 或 存储 在 异步 结果 中 的 异常 ， 如 果 有 的 话 。 

后 置 条 件 
this-»valid()--false 


D.4.2 std::shared future 类 模板 


std: :shared_future 类 模板 提供 了 从 另 一 线程 等 待 异 步 结 果 的 方法 ， 
与 std: :promise、std: :packaged task 类 模板 和 std: :async 函 数 模 板 联合 使 
用 ， 可 以 用 来 提供 此 异步 结果 。 多 个 std: :shared future 实例 可 以 引用 同一 个 


已 上 上 ZE 
异步 结果 。 


std::shared future 的 实例 是 CopyConstructib1le 或 CopyAssignable 
的 。 你 也 可 以 从 具有 相同 ResultType 的 std: :future 中 移动 构造 一 


个 std: :shared furture。 


访问 给 定 的 std: :shared_future 实 例 不 是 同步 的 。 因 此 多 个 线程 在 没有 外 
部 同步 的 情况 下 访问 同一 个 std: :shared_future 实 例 是 不 安全 的 。 但 是 访问 关 
联 状态 是 同步 的 ， 所 以 多 个 线程 在 没有 外 部 同步 的 情况 下 ， 各 自 访问 共享 相同 的 
关联 状态 的 std: : shared future 独立 的 实例 是 安全 的 。 


template<typename ResultType> 
class shared future 
{ 
public: 
shared future() noexcept; 
shared future(future«ResultType»&&) noexcept; 


shared future (shared future&&) noexcept; 

shared future(shared future const&); 

shared future& operator- (shared future const&); 
shared future& operator-(shared future&&) noexcept; 
~shared_ future(); 


bool valid() const noexcept; 
see description get() const; 
void waití() const; 


template«typename Rep,typename Period» 
future status wait fort 
std::chrono: :duration<Rep, Period> const& relative time) const; 


template<typename Clock,typename Duration» 
future status wait until( 
Std::chrono::time point«Clock,Duration» const& absolute time) 
const; 


std::shared futureEA i 135 p X 
构造 与 异步 结果 没有 关联 的 std: :shared_future 对 象 。 
声明 


shared future() noexcept; 


结果 
构造 一 个 新 的 std: :shared future 实例 。 
后 置 条 件 
对 于 新 构造 的 实例 ，valid() 返 回 false。 
引发 
无 。 
std::shared_future 移 动 构造 函数 
从 另 一 个 std: :shared_future 对 象 中 构造 std: :shared_future 对 象 ， 将 
aoe : :shared_future 对 象 关联 的 异步 结果 的 所 有 权 转 移 到 新 构造 的 实例 
声明 
shared future(shared future&& other) noexcept; 
"i 
从 other 移 动 构造 一 个 新 的 std: :shared_future 实 例 。 
后 置 条 件 


在 调用 此 构造 孙 数 之 前 与 other 关 联 的 异步 结果 ， 现 在 被 关联 至 新 构造 的 
std: :shared future 对 象 。other 没 有 关联 异步 结果 。 


引发 
Wee 
std::shared future 从 std::future 的 移动 构造 函数 


从 一 个 std: :future 对 象 中 构造 std: :shared_future 对 象 ， 将 
与 std: :future 对 象 关联 的 异步 结果 的 所 有 权 转 移 到 新 构造 的 实例 中 。 


声明 
shared future (std: :future<ResultType>&& other) noexcept; 


+ 
zh 


从 other 移动 构造 一 个 新 的 std: :shared_future 实 例 。 
后 置 条 件 


在 调用 此 构造 函数 之 前 与 other 关联 的 异步 结果 ， 现 在 被 关联 至 新 构造 的 
std::shared future 对 象 。other 没 有 关联 异步 结果 。 


引发 
Tes 
std::shared_future?% J)! 1435 p AV 


从 另 一 个 std: :shared_future 对 象 中 构造 std: :shared_future 对 象 ， 
而 源 和 副本 都 会 指向 与 源 std: :shared_future 对 象 关联 的 异步 结果 ， 如 果 有 的 


ih. 
声明 
shared future(shared future const& other}; 
结 
构造 一 个 新 的 std: :shared future 实例 。 
后 置 条 件 


在 调用 此 构造 函数 之 前 与 other 关联 的 异步 结果 ， 现 在 被 关联 至 新 构造 的 
std::shared future 对 象 和 other。 


引发 
无 。 
std::shared_future 析 构 函 数 
销毁 std: :shared future 对 象 。 
声明 
~Shared future(}; 
结果 
销毁 *this。 如 果 不 再 有 std: :promise 或 std: :packaged_task 实 例 与 关联 


至 *this 的 异步 结果 相关 联 ， 并 且 这 是 对 关联 至 *this 的 异步 结果 的 最 后 一 
个 std: :shared future， 那 么 销毁 该 异步 结果 。 


引发 
ye 
std::shared_future::valid i 5i PK ZA 
检查 std: :shared_future 实 例 是 否 关 联 至 异步 结果 。 
声明 
bool valid() const noexcept; 
返回 
如 有 果 *this 已 关联 至 异步 结果 ， 返 回 true， 人 否则 返回 false。 
引发 
Tie 
std::shared future::wait/X, 5i PK ZA 


如 果 关联 至 *this 的 状态 包含 延迟 函数 ， 调 用 此 延迟 函数 。 和 否则， 一 直 等 待 
到 关联 至 std: :shared_future 实 例 的 异步 结果 就 绪 。 


声明 
void wait() const; 
前 置 条 件 
this->valid() 应 返回 true。 
结果 


来 自在 共享 相同 关联 状态 的 std: :shared_future 实 例 上 多 线程 的 get() 和 
wait( ) 调 用 是 序列 化 的 。 如 条 关联 状态 包含 延迟 函数 ， 首次 调用 get() 或 wait() 
会 调用 此 延迟 函数 并 存储 返回 值 或 将 引发 的 异常 存储 为 异步 结果 。 


阻塞 直到 关联 至 *this 的 异步 结果 就 绪 。 
引发 


无 o 
std::shared future::wait for 成员 函数 


直 等 待 到 关联 至 std: :shared future 实例 的 异步 结果 就 绪 ， 或 者 直到 指 
定 的 时 间 段 逝去 。 
声明 


template<typename Rep, typename Period> 
future status wait_for ( 
std::chrono: :duration<Rep, Period> const& relative time) const; 


前 置 条 件 

this->valid() 应 返回 true。 

结果 

如 果 关 联 至 *this 的 异步 结果 包含 延迟 函数 ， 它 是 从 对 std:async 的 调用 发 
起 的 且 尚 未 开始 执行 ， 则 立即 返回 不 进行 阻塞 。 人 否则 一 直 阻 塞 到 关联 至 *this 的 
异步 结果 就 结 ， 或 者 由 relative _ time 指定 的 时 间 段 逝去 。 

返回 

如 果 关 联 至 *this 的 异步 调用 包含 延迟 函数 ， 它 是 从 对 std:async 的 调用 发 
起 的 且 尚 未 开始 执行 ， 返 回 std: :future_status::deferred， 如 果 关 联 至 


*this 的 异步 结果 就 绕 ， 返 回 std: :future_status: :ready， 如 果 
由 relative_time 指 定 的 时 间 段 逝去 则 返回 std: :future_status::timeout。 


TE “线程 可 能 会 比 指定 的 时 间 段 阻塞 得 更 入。 如果 可 能 ， 逝 去 
时 间 应 由 匀速 时 钟 决定 。 


引发 
无 。 


std::shared_future::wait_until ik m PA BL 


直 等 待 到 关联 至 std: : shared_future 实 例 的 异步 结果 就 绪 ， 或 者 到 达 一 
个 指定 的 时 间 。 
声明 
template<typename Clock,typename Duration> 


bool wait_until ( 
std::chrono::time point«Clock,Duration» const& absolute time) const; 


前 置 条 件 
this->valid() 应 返回 true。 
结果 


如 果 关 联 至 *this 的 异步 结果 包含 延迟 函数 ， 它 是 从 对 std:async 的 调用 发 
起 的 且 尚 未 开始 执行 ， 则 立即 返回 不 进行 阻塞 。 否 则 一 直 阻 塞 到 关联 至 *this 的 
异步 结果 就 绪 ， 或 者 Clock: :now() 返 回 一 个 等 于 或 晚 于 absolute_ time 的 时 
IH] 。 

返回 

如 果 关 联 至 *this 的 异步 调用 包含 延迟 函数 ， 它 是 从 对 std:async 的 调用 发 
起 的 且 尚 未 开始 执行 ， 返 回 std: :future_status: :deferred， 如 果 关 联 至 
*this 的 异步 结果 就 绪 ， 返 回 std: :future_status: :ready， 如 果 


Clock: :now() 返 回 一 个 等 于 或 晚 于 absolute_time 的 时 间 则 返回 
std::future status::timeout. 


注 ”不 能 保证 调用 线程 会 被 阻塞 多 久 ， 只 有 当 函 数 返 回 
std::future status::timeout， 且 Clock: :now() 返 回 一 个 等 于 
或 晚 于 absolute_time 的 时 间 的 时 候 ， 线 程 才 会 被 解锁 。 


引发 
无 o 
std::shared future::get/X, 7i PK Zt 


如 果 关 联 着 的 状态 包含 一 个 来 自 对 std: :async 调 用 的 延迟 函数 ， 调 用 该 函 


数 并 返回 值 。 和 否则 ， 一 直 等 待 到 关联 至 std: :shared future 实例 的 异步 结果 就 
绪 ， 接 着 返回 存储 的 值 或 引发 存储 的 异常 。 


声明 
void shared future<void>: :get {) const; 


R& shared. future<R&>: :get() const; 
R const& shared future<R>::get() const; 


前 置 条 件 

this->valid() 应 返回 true。 

结果 

来 自在 共享 相同 关联 状态 的 std: :shared_future 实 例 上 多 线程 的 get() 和 
wait() 调 用 是 序列 化 的 。 如 果 关 联 状态 包含 延迟 函数 ， 首 次 调用 get() 或 wait() 
会 调用 此 延迟 函数 并 存储 返回 值 或 将 引发 的 异常 存储 为 异步 结果 。 


一 直 阻 塞 到 关联 至 *this 的 异步 结果 就 绕 。 如 果 结 果 是 存储 的 异常， 引发 该 
异常 。 否 则 ， 返 回 存储 的 值 。 


返回 


如 果 ResultType 是 void， 正 常 返 回 。 如 果 ResultType 是 某 些 类 型 R 的 R&， 
返回 存储 的 引用 。 人 否则 ， 返 回 对 存储 值 的 const 引 用 。 


引发 
存储 的 异常 ， 如 果 有 的 话 。 


D.4.3 std::packaged_task 类 模板 


std: :packaged_task 类 模板 打包 了 函数 或 其 他 可 调用 对 象 ， 以 便 在 函数 经 
过 std: :packaged_task 实 例 调 用 的 时 候 ， 结 果 被 存储 为 异步 结果 ， 可 以 通过 
std: :future 的 实例 来 取得 。 


std::packaged task 的 实例 是 MoveConstructible 和 MoveAssignable 
的 ， 但 不 是 CopyConstructible 或 CopyAssignable 的 。 


template<typename FunctionType> 
class packaged_task; // undefined 


template<typename ResultType, typename... ArgTypes> 
class packaged task<ResultType (ArgTypes...}> 


{ 


public: 


}; 


packaged_task{} noexcept; 
packaged task (packaged task&&) noexcept; 
~packaged task () ; 


packaged task& operator-(packaged task&&) noexcept; 


packaged task (packaged task const&) = delete; 
packaged task& operator-(packaged task const&) - delete; 


void swap (packaged task&) noexcept; 


template«typename Callable> 
explicit packaged task(Callable&& func); 


template«typename Callable,typename Allocator> 
packaged taskí(std::allocator arg t, const Allocator&, Callable&&) ; 


bool valid() const noexcept; 
std::future«ResultType» get future(); 

void operatorí)(ArgTypes...); 

void make ready at thread exit(ArgTypes...); 
void reset(); 


std::packaged_task 默 认 构 造 函 数 


构造 std: :packaged task 对 象 。 


声明 


packaged task() noexcept; 


结果 

构造 没有 关联 任务 和 异步 结果 的 std: :packaged_task 实 例 。 
引发 

Tos 


std::packaged_task 从 可 调用 对 象 的 构造 函数 
构造 有 关联 任务 和 异步 结果 的 std: :packaged_task 实 例 。 
声明 


template<typename Callable> 
packaged task (Callable&& func); 


前 置 条 件 


表达 式 func(args...) 应 有 效 ， 这 里 args.. .中 的 每 个 元 素 args-i 都 必须 是 
相应 的 ArgTypes. . .中 ArgType-i 类 型 的 值 。 返 回 值 必须 能 够 转换 
为 ResultType。 


+ 
结 


构造 std: :packaged_task 实 例 ， 带 有 未 就 绪 的 ResultType 类 型 的 关联 异步 
结果 以 及 func 副 本 的 callable 类 型 的 关联 任务 。 


引发 


如 果 构 造 函数 不 能 为 异步 结果 分 配 内 存 ， 引 发 std: :bad_alloc 的 异 
常 。Callable 的 拷贝 或 移动 构造 函数 引发 的 任何 异常 。 


std::packaged_task 从 带 有 分 配器 的 可 调用 对 象 的 构造 函数 

构造 有 关联 任务 和 异步 结果 的 std: :packaged task 实例 ， 使 用 所 给 的 分 配 
器 来 为 关联 的 异步 结果 和 任务 分 配 内 存 。 

声明 


template<typename Allocator,typename Callable> 


packaged task ( 
std::allocator_arg t, Allocator const& alloc,Callable&& func) ; 


前 置 条 件 


表达 式 func(args...) 应 有 效 ， 这 里 args.. .中 的 每 个 元 素 args-i 都 必须 是 
相应 的 ArgTypes. . .中 ArgType-i 类 型 的 值 。 返 回 值 必须 能 够 转换 
为 ResultType。 


结果 


构造 std: :packaged_ task 实例 ， 带 有 未 就 绪 的 ResultType 类 型 的 关联 异步 
结果 以 及 func 副 本 的 Callable 类 型 的 关联 任务 。 异 步 结果 和 任务 的 内 存 是 通过 
分 配器 alloc 或 其 副本 来 分 配 的 。 

引发 


如 果 构 造 函数 不 能 为 异步 结果 分 配 内 存 ， 引 发 std: :bad_alloc 的 异常 。 
由 Call1able 的 拷贝 或 移动 构造 函数 引发 的 任何 异常 。 


std::packaged_task 移 动 构造 函数 


从 男 一 个 std: :packaged_task 对 象 中 构造 std: :packaged, task 对象， 将 
"NL : :packaged_task 对 象 关联 的 异步 结果 的 所 有 权 转 移 到 新 构造 的 实例 


声明 
packaged task (packaged task&& other) noexcept; 

结果 

从 other 移动 构造 一 个 新 的 std: :packaged_task 实 例 。 

后 置 条 件 


在 调用 此 构造 函数 之 前 与 other 关联 的 异步 结果 ， 现 在 被 关联 至 新 构造 的 
std::packaged task 对 象 。other 没 有 关联 异步 结果 。 


引发 
无 o 
std::packaged_task 移 动 赋值 运算 符 


将 于 一 个 std: :packaged_task 对 象 关联 的 异步 结果 的 所 有 权 转 移 到 另 一 个 
对 象 中 。 


声明 
packaged task& operator-(packaged task&& other) noexcept; 
结果 


将 关联 至 other 的 异步 结果 和 任务 的 所 有 权 转 移 至 *this， 并 且 舍弃 所 有 之 
前 的 异步 结果 ， 如 同 std: :packaged_task(other).swap(*this). 


后 置 条 件 


在 调用 此 构造 函数 之 前 与 other 关联 的 异步 结果 ， 现 在 被 关联 至 新 构造 的 
std: :future 对象。other 没 有 关联 异步 结果 。 


引发 
无 。 
std::packaged_task::swap 成 员 函 数 
交换 关联 至 两 个 std: :packaged_task 对 象 的 异步 结果 的 所 有 权 。 
声明 
void swap(packaged task& other) noexcept; 
结果 
交换 关联 至 other 和 *#this 的 异步 结果 的 所 有 权 。 
后 置 条 件 


在 调用 swap 之 前 关联 至 other 的 异步 结果 和 任务 〈 如 果 有 ) 现在 关联 至 
*this。 在 调用 swap 之 前 关联 至 *this 的 异步 结果 和 任务 (如 果 有 )〉 现在 关联 至 


other. 
引发 
TE 
std::packaged_task 析 构 函 数 
销毁 std: :packaged task 对 象 。 
声明 
~packaged task () ; 
结果 
销毁 *this。 如 果 *this 拥 有 关联 的 异步 结果 ， 且 该 结果 没有 存储 任务 或 异 


常 ， 那 么 此 结果 变 成 就 纤 ， 带 有 std: :future_errc: :broken_promise 错 误 码 
的 std: :future_error 异 常 。 


引发 
无 。 
std::packaged_task::get_future 成 员 函 数 
为 关联 至 *this 的 异步 结果 获取 std: :future 实 例 。 
声明 
std::future<ResultType> get future () ; 
前 置 条 件 
*this 拥 有 关联 的 异步 结果 。 
返回 
针对 关联 至 *this 的 异步 结果 的 std: :future 实 例 。 
引发 
如 果 std: :future 已 经 在 之 前 通过 调用 get_future( ) 获 取 过 了 ， 引 发 带 


有 std: :future_errc::future_already_retrieved 错 误 码 的 
std: :future_error 类 型 的 异常 。 


std::packaged_task::reset 成 员 函 数 
为 同一 个 任务 关联 std: :packaged _ task 至 新 的 异步 结果 。 
声明 
void reset (); 
前 置 条 件 
*this 拥 有 关联 的 异步 任务 。 


ie 
结 


如 同 *this=packaged task(std: :move(f))， 这 里 f 是 已 存储 的 关联 至 
*this 的 任务 。 


引发 


如 果 不 能 为 新 的 异步 结果 分 配 内 存 ， 引 发 std: :bad_alloc 的 异常 。 
std::packaged_task::valid 成 员 函 数 

检查 *this 是 否 拥有 相关 联 的 已 步 结 

声明 
bool valid() const noexcept ; 

返回 

如 有 果 *this 已 关联 至 异步 结果 ， 返 回 true， 人 否则 返回 false。 

引发 

Tee 
std::packaged_task::operator() 24 Zi i5 His FF 


调用 关联 至 std: : packaged task 实例 的 任务 ， 并 且 将 返回 值 或 异常 存储 在 
相关 联 的 异步 结果 中 。 


声明 
void operator() (ArgTypes... args); 

前 置 条 件 

*this 拥 有 关联 的 任务 。 

结果 

像 INVOKE(func,args...) 那 样 调用 关联 的 任务 func。 如 果 调 用 正常 地 返 
回 ， 将 返回 值 存储 在 关联 至 *this 的 异步 结果 中 。 如 果 调 用 带 腊 常 地 返回 ， 将 
异常 存储 在 关联 至 *this 的 异步 结果 中 。 

后 置 条 件 


关联 至 *this 的 异步 结果 就 绪 ， 带 有 存储 的 值 或 异常 。 所 有 等 竺 异步 结果 的 
被 阻 竖 线程 全 部 解除 阻塞 。 


引发 
如 果 异 步 结 果 已 经 拥有 了 存储 的 值 或 异常 ， 引 发 带 


有 std: :future_errc::promise already _satisfied 错 误 码 的 
std: :future_error 类 型 的 异常 。 


同步 
成 功 的 对 函数 调用 运算 符 进行 调用 ， 与 对 
std: : future<ResultType>: :get() 
或 std: :shared future<ResultType>: :get() 的 调用 同步 ， 它 们 获取 已 存储 的 
值 或 异常 。 
std::packaged_task::make_ready_at_thread_exit 成 员 函 数 


调用 关联 至 std: :packaged task 实例 的 任务 ， 并 且 将 返回 值 或 异常 存储 在 
相关 联 的 异步 结果 中 ， 直 到 线程 结束 前 都 不 将 关联 的 异步 结果 变 为 就 绪 。 


声明 


void make_ready_at_thread_exit(ArgTypes... args); 
前 置 条 件 
*this 拥 有 关联 的 任务 。 


+ 
结 


像 INVOKE(func,args...) 那 样 调用 关联 的 任务 func。 如 果 调 用 正常 地 返 
回 ， 将 返回 值 存储 在 关联 至 *this 的 异步 结果 中 。 如 果 调 用 带 有 异常 地 返回 ， 将 
异常 存储 在 关联 至 *this 的 异步 结果 中 。 调 度 关 联 的 异步 状态 在 当前 线程 退出 的 
时 候 变 为 就 绪 。 


后 置 条 件 


关联 至 *this 的 异步 结果 拥有 存储 的 值 或 异常 ， 但 直到 当前 线程 推出 之 前 都 
不 是 就 绪 的 。 所 有 等 待 异步 结果 的 被 阻 窄 线程 在 当前 线程 退出 时 全 部 解除 阻 器 。 


SUA 
如 果 异 步 结 果 已 经 拥有 了 存储 的 值 或 异常 ， 引 发 带 


有 std: :future_errc::promise already satisfiediiixign 
std: :future_error 类 型 的 异常 。 如 果 *this 没 有 相关 联 的 同步 状态 ， 引 发 带 
有 std: :future_errc::no_state 的 std: :future_error 类 型 的 异常 。 


成 功 的 对 函数 调用 运算 符 进 行 调 用 ， 与 对 
std: :future<ResultType>::get() 
或 std: :shared future<ResultType>: :get() 的 调用 同步 ， 它 们 获取 已 存储 的 
值 或 异常 。 


D.4.4 std::promise 类 模板 


std: :promise 类 模板 提供 了 从 设置 异步 结果 的 方法 ， 可 以 通过 
std: :future 实例 从 另 一 线程 获取 它 。 


ResultType 模 板 参 数 是 可 以 被 存储 在 异步 结果 的 值 的 类 型 。 


关联 至 特定 的 std: :promise 实 例 的 异步 结果 的 std: :future 可 以 通过 调 
用 get_future() 成 员 函 数 来 获得 。 异 步 结 果 既 可 以 用 set_value() 成 员 函 数 设 
置 为 ResultType 类 型 的 值 ， 也 可 以 使 用 set_exception() 成 员 函 数 设 置 为 一 个 
异常 。 

std: :future 的 实例 是 MoveConstructible 和 MoveAssignable 的 ， 但 不 
是 CopyConstructible 或 CopyAssignable 的 。 


template<typename ResultType> 
class promise 


{ 
public; 
promise (); 
promise (promise&&) noexcept; 
-promise(); 
promise& operator=(promise&&) noexcept; 


template«typename Allocator> 
promise(std::allocator arg t, Allocator const&); 


promise (promise const&) = delete; 
promise& operator=(promise const&) = delete; 


void swap(promise& ) noexcept; 
std: :future<ResultType> get future); 


void set value(see description); 

void get exception (stds exception ptr pj; 
js 
std::promise 默 认 构造 函数 

构造 std: :promise 对 象 。 

声明 
promise ({}; 

结果 


构造 std: :promise 实 例 ， 与 一 个 没有 就 绪 的 ResultType 类 型 的 异步 结果 相 
关联 。 


引发 
如 果 构 造 函数 不 能 为 异步 结果 分 配 内 存 ， 引 发 std: :bad_alloc# ii. 


std::promise 分 配器 构造 函数 


构造 std: :promise 对 象 ， 使 用 所 给 的 分 配器 为 关联 的 异步 结果 分 配 内 存 。 
声明 


template<typename Allocator> 
promise (std: :allocator arg t, Allocator const& alloc); 


结果 


构造 std: :promise 实 例 ， 与 一 个 没有 就 绪 的 ResultType 类 型 的 异步 结果 相 
关联 。 通 过 分 配器 alloc 为 异步 结果 分 配 内 存 。 


引发 
构造 器 在 试图 为 异步 结果 分 配 内 存 是 引发 的 所 有 异常 。 
std::promise 移 动 构造 函数 


从 另 一 个 std: :promise 对 象 中 构造 std: :promise 对 象 ， 将 与 另 
一 std: :promise 对 象 关联 的 异步 结果 的 所 有 权 转 移 到 新 构造 的 实例 中 。 


声明 
promise (promise&& other) noexcept; 

结果 

构造 一 个 新 的 std: :promise 实 例 。 

后 置 条 件 


在 调用 此 构造 函数 之 前 与 other 关联 的 异步 结果 ， 现 在 被 关联 至 新 构造 的 
std: :promise 对 象 。other 没 有 关联 异步 结 


引发 
无 。 

std::promise 移 动 赋值 运算 符 

p, 将 于 一 个 std: :promise 对 象 关联 的 异步 结果 的 所 有 权 转 移 到 另 一 个 对 象 


声明 


promise& operator=(promise&& other) noexcept; 

结 

将 关联 至 other 的 异步 结果 的 所 有 权 转 移 给 *this。 如 果 *this 已 经 有 了 相关 
联 的 异步 结果 ， 该 异步 结果 变 为 就 绪 ， 玫 
有 std: :future_errc::broken_promise 错 误 码 的 std: :future_error 类 型 的 
已 AY 
FF mio 


后 置 条 件 


在 调用 此 构造 函数 之 前 与 other 关联 的 异步 结果 ， 现 在 被 关联 至 新 构造 的 
std: :future 对象。other 没 有 关联 异步 结果 。 


std::promise::swap 成 员 函 数 
交换 关联 至 两 个 std: :promise 对 象 的 异步 结果 的 所 有 权 。 
声明 
void swapí(promise& other); 
结果 
交换 关联 至 other 和 *this 的 异步 结果 的 所 有 权 。 
后 置 条 件 
在 调用 swap 之 前 关联 至 other 的 异步 结果 和 任务 《如 果 有 ) 现在 关联 至 
在 调用 swap 之 前 关联 至 *this 的 异步 结果 和 任务 (如 果 有 ) 现在 关联 至 
引发 
Js 
std::promise 析 构 函 数 


销毁 std: :promise 对 象 。 

声明 
~promise () ; 

结果 

销 磺 *this。 如 果 *this 拥 有 关联 的 异步 结果 ， 且 该 结果 没有 存储 任务 或 异 
常 ， 那 么 此 结果 变 成 就 绕 ， 带 有 std: :future_errc: :broken_promise 错 误 码 
的 std: :future_error 异 常 。 

引发 

7s 
std::promise::get_future 成 员 函 数 


为 关联 至 *this 的 异步 结果 获取 std: :future 实 例 。 


声明 
std: :future<ResultType> get future() ; 
前 置 条 件 
*this 拥 有 关联 的 异步 结果 。 
返回 
针对 关联 至 *this 的 异步 结果 的 std: :future 实 例 。 
引发 


如 果 std: :future 已 经 在 之 前 通过 调用 get_future() 获 取 过 了 ， 引 发 带 
fistd::future errc::future already_retrieved 错 误 码 的 
std: :future_error 类 型 的 异常 。 
std::promise::set_value 成 员 函 数 


将 一 个 值 存 储 在 与 *this 相 关联 的 异步 结果 中 。 


声明 


void promise«void»::set value(); 

void promise<R&>::set_value(R& r); 

void promise«R»::set value(R const& r); 
void promise«R»::set value(R&& r); 


前 置 条 件 

*this 拥 有 关联 的 异步 任务 。 

结果 

如 果 ResultType 不 是 void， 就 将 r 存 储 在 与 *this 关 联 的 异步 结果 中 。 
后 置 条 件 


关联 至 *this 的 寞 步 结 果 就 纤 ， 带 有 存储 的 值 。 所 有 等 竺 异步 结果 的 被 阻 塞 
线程 全 部 解除 阻塞 。 

引发 

如 采 异 步 结果 已 经 拥有 了 存储 的 值 或 异常 ， 引 发 市 


有 std: :future_ errc::promise already_satisfied 错 误 人 码 的 


std: :future_error 类 型 的 异常 。 由 Fr 的 拷贝 构造 函数 或 移动 构造 函数 引发 的 所 


多 个 并 发 的 
set value(). set value at thread exit(). set exception()4l 
set exception at thread _exit() 调 用 都 是 序列 化 的 。 成 功 的 对 
set_value() 进 行 调用 ， 发 生 于 对 std: : future<ResultType>: :get() 
Mstd::shared future<ResultType>: :get() 之 前 ， 它 们 获取 已 存储 的 值 。 


std::promise::set_value_at_thread_exit 成 员 函 数 


将 值 存储 在 与 *this 相 关联 的 异步 结果 中 ， 直 到 线程 结束 前 都 不 将 关联 的 寞 
步 结 果 变 为 就 绪 。 


声明 


void promise«void»::set value at thread exit(); 

void promise«R&»::set value at thread exit(R& r}; 

void promise<R>::set value at thread exit(R const& r); 
void promise<R>::set value at thread exit (R&& r); 


前 置 条 件 
*this 拥 有 关联 的 异步 结果 。 
结果 


如 果 ResultType 不 是 void， 就 将 r 存 储 在 关联 至 *this 的 异步 结果 中 。 将 异 
步 结果 标记 为 拥有 存储 的 值 。 调 度 关 联 的 异步 结果 在 当前 线程 退出 的 时 候 变 为 就 


= 


后 置 条 件 


关联 至 *this 的 异步 结果 拥有 存储 的 值 ， 但 直到 当前 线程 推出 之 前 都 不 是 就 
绪 的 。 所 有 等 待 异 步 结果 的 被 阻塞 线程 在 当前 线程 退出 时 全 部 解除 阻塞 。 


引发 
如 果 异 步 结果 已 经 拥有 了 存储 的 值 或 异常 ， 引 发 这 


有 std: :future_errc::promise _ already_satisfied 错 误 码 的 
std: :future_error 类 型 的 异常 。 由 r 的 拷贝 构造 函数 或 移动 构造 函数 引发 的 所 
4n. 


同步 


多 个 并 发 的 
set value(). set value at thread exit(). set exception()4l 
set exception at _thread_exit() 调 用 都 是 序列 化 的 。 成 功 的 对 
set_value at thread exit() 进 行 调用 ， 发 生 于 对 
std: :future<ResultType>::get() 
或 std: :shared future<ResultType>::get() 之 前 ， 它 们 获取 已 存储 的 值 。 


std::promise::set, exception, 5i PK Zt 
将 一 个 异常 存储 在 与 *this 相 关联 的 异步 结果 中 。 
声明 


void set_exception (std: :exception ptr e); 


前 置 条 件 

*this 拥 有 关联 的 异步 任务 。(bool)e 为 true。 
结果 

将 e 存 储 在 与 *this 关 联 的 异步 结果 中 。 
后 置 条 件 


关联 至 *this 的 异步 结果 就 绕 ， 币 有 存储 的 寞 第 。 所 有 等 待 异 步 结果 的 被 阻 
塞 线程 全 部 解除 阻塞 。 


引发 
如 采 异 步 结果 已 经 拥有 了 存储 的 值 或 异常 ， 引 发 这 


有 std: :future_errc::promise already satisfiediixign 
std: :future_error 类 型 的 异常 。 


同步 
多 个 并 发 的 


set value(). set value at thread exit(). set exception() 和 

set exception at thread _exit() 调 用 都 是 序列 化 的 。 成 功 的 对 

set value() 进 行 调 用 ， 发 生 于 对 std: :future<ResultType>: :get() 

或 std: :shared future<ResultType>: :get() 之 前 ， 它 们 获取 已 存储 的 异常 。 


std::promise::set_exception_at_thread_exit 成 员 函 数 


将 异常 存储 在 与 *this 相 关联 的 异步 结果 中 ， 直 到 线程 结束 前 都 不 将 关联 的 
异步 结果 变 为 就 绪 。 


声明 
void set exception at thread exit (std::exception ptr e); 
前 置 条 件 
*this 拥 有 关联 的 异步 结果 。(bool)e 为 true。 
结 


将 e 存 储 在 关联 至 *this 的 异步 结果 中 。 调 度 关 联 的 异步 结果 在 当前 线程 退出 
的 时 候 变 为 就 绪 。 


后 置 条 件 


关联 至 *this 的 异步 结果 拥有 存储 的 异常 ， 但 直到 当前 线程 退出 之 前 都 不 是 
就 绪 的 。 所 有 等 待 异 步 结 果 的 被 阻塞 线程 在 当前 线程 退出 时 全 部 解除 阻塞 。 


引发 
如 采 异 步 结果 已 经 拥有 了 存储 的 值 或 异常 ， 引 发 这 


有 std: :future_errc::promise _ already_satisfied 错 误 码 的 
std: :future_error 类 型 的 异常 。 


同步 
多 个 并 发 的 


set value(). set value at thread exit()、set exception() 和 

set exception at thread exit() 调 用 都 是 序列 化 的 。 成 功 的 对 

set exception at thread exit() 进 行 调用 ， 发 生 于 对 

std: :future<ResultType>::get() 

或 std: :shared future<ResultType>::get() 之 前 ， 它 们 获取 已 存储 的 异常 。 


D.4.5 std::asyncrK ZU 


std: :async 是 一 种 利用 现成 的 硬件 并 发 来 运行 自 包 含 异步 人 物 的 简单 途 
径 。 对 std: :async 的 调用 返回 一 个 包含 任务 结果 的 std: :future。 取 决 于 启动 
策略 ， 该 任务 可 以 异步 地 运行 在 它 自己 的 线程 上 ， 也 可 以 同步 地 运行 于 任何 在 此 
future 调 用 wait() 或 get() 成 员 函 数 的 线程 上 。 


声明 
enum class launch 
{ 

async, deferred 
s 
template<typename Callable,typename ... Args>» 
future«result of«Callable(Args...)s::type» 
async(Callable&& func,Args&& ... args); 
template«typename Callable,typename ... Args» 


future«result of«Callable(Args...)»::type- 
async (launch policy,Callable&& func,Args&& ... args); 


前 置 条 件 


对 于 所 给 的 func 和 args 值 ， 表 达 式 INVOKE(func,args) 是 有 效 
地 。Callable 和 Args 的 所 有 成 员 都 是 MoveConstructible 的 。 


结果 
在 内 部 存储 中 构造 func 和 args.. .的 副本 (分 别 记 为 fff 和 xyz...)。 


如 果 policy 是 std: :launch: :async， 在 其 自己 的 线程 上 运 
行 INVOKE(fff, xyz. . .) 。 所 返回 的 std: :future 会 在 此 线程 完成 的 时 候 变 为 就 
绪 ， 并 且 会 持 有 返回 值 或 有 函数 调用 所 引发 的 异常 。 最 后 一 个 与 std: :future 返 
回 的 异步 状态 同步 的 future 对 象 的 析 构 函数 会 一 直 被 阻塞 到 future 就 绪 。 


如 果 policy 是 std: :launch: :deferred，fff 和 xyz.. .会 作为 延迟 函数 调 
用 被 存储 在 所 返回 的 std: :future 中 。 在 共享 相同 关联 状态 的 future 上 首次 对 
wait() 或 get() 成 员 函 数 的 调用 ， 会 同步 地 在 调用 wait() 或 get() 的 线程 上 执 
fTINVOKE(fff,xyz...). 


通过 执行 INVOKE(fff, xyz. . .) 所 返回 的 值 或 引发 的 异常 ， 会 从 在 该 
std: :future 上 对 get() 的 调用 中 返回 。 


如 果 policy 是 std: :launch::async | std::launch::deferred 
或 pol1icy 参 数 被 省 略 ， 该 行为 如 同 std: :launch: :async 
或 std: : launch: :deferred 之 一 被 指定 。 此 实现 会 基于 call-by-call 理 论 选 择 具体 
行为 ， 以 便利 用 可 用 的 硬件 并 发 且 没有 超 量 的 过 度 订 阅 。 


在 所 有 情况 下 ， 对 std: :async 的 调用 立刻 返回 。 
同步 


函数 调用 的 完成 ， 发 生 于 成 功 从 在 引用 相同 关联 状态 的 std: :future 
或 std: :shared future 实例 上 对 wait()、get()、wait for() 
或 wait_until() 的 调用 中 返回 之 前 ， 如 std: :future 对 象 从 std: :async 的 调用 
中 返回 。 在 std: :launch: :async 的 policy 情 况 下 ， 函 数 调用 所 在 的 线程 的 完成 
同样 发 生 于 成 功 从 这 些 调用 返回 之 前 。 


引发 
如 果 无 法 分 配 所 需 的 内 部 存储 ， 引 发 std: :bad_alloc 异 常 ， 否 则 当 无 法 达 
成 结果 或 在 构造 fff 和 xyz.. .时 引发 了 任何 的 异常 ， 就 引发 std: :future_error 


E Awe 
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D.5 ”<mutex> 头 文件 


<mutex> 头 文件 提供 了 担保 互 斥 的 功能 : 互 斥 元 类 型 、 锁 类 型 和 函数 ， 以 及 


确保 一 项 操作 恰好 被 执行 一 次 的 机 制 。 


头 文件 内 容 


namespace std 


{ 


class mutex; 

class recursive_mutex; 

class timed_mutex; 

class recursive timed mutex; 


struct adopt lock t; 
struct: derer lock t; 
struct try to lock t; 


constexpr adopt lock t adopt_lock{}; 
constexpr defer lock t defer lock(]; 
constexpr try to lock t try to lock(); 


template«typename LockableType» 
class lock guard; 


template«typename LockableType> 
class unique lock; 


template<typename LockableTypel,typename... LockableType2> 
void lock (LockableTypel& m1,LockableType2& m2...); 


template<typename LockableTypel,typename... LockableType2> 
int try lock(LockableTypel& m1, LockableType2& m2...); 


struct once flag; 


template«typename Callable,typename... Args» 
void call once(once flag& flag,Callable func,Args args...); 


D.5.1 std::mutex2 


std: :mutex 类 为 线程 提供 了 基本 的 互 斥 与 同步 机 制 ， 可 用 来 保护 共享 数 
据 。 在 访问 互 斥 元 所 保护 的 数据 之 前 ， 该 互 斥 元 必须 通过 调用 lock( ) 
或 try_lock() 来 锁定 。 在 同一 时 刻 仅 有 一 个 线程 可 以 持 有 这 个 锁 ， 如 果 另 一 个 
线程 也 试图 锁定 此 互 斥 元 ， 就 会 失败 或 被 适当 地 阻塞 。 一 旦 线程 完成 了 访问 共享 
数据 ， 它 必须 接着 调用 unlock() 来 释放 锁 ， 并 人 允许 其 他 线程 获得 它 。 

std: :mutex 满 足 Lockable 的 需求 。 
class mutex 
{ 
public: 

mutex (mutex const&)-delete; 

mutex& operator=(mutex const&)=delete; 


constexpr mutex() noexcept; 
~mutex (}; 


void lock(); 
void unlockí); 
bool try Lock); 


\; 
std::mutex 默 认 构 造 函 数 
构造 std: :mutex 对 象 。 
声明 
constexpr mutex(} noexcept; 
结果 
构造 std: :mutex 实 例 。 
后 置 条 件 
新 构造 的 std: :mutex 对 象 初始 是 未 锁定 的 。 
抛 出 


std::mutex 析 构 函 数 
销毁 std: :mutex 对 象 。 
声明 
~mutex () ; 
前 置 条 件 
*this 不 得 被 锁定 。 
结果 
销毁 *this。 
抛 出 
X. 
std: :mutex::lock/X 53 2 Zt 
为 当前 线程 获取 在 std: :mutex 对 象 上 的 锁 。 
声明 
void lock(); 
前 置 条 件 
调用 线程 不 得 持 有 *#this 上 的 锁 。 
结果 
阻塞 当前 线程 ， 直 到 能 够 获得 *this 上 的 锁 。 
后 置 条 件 
*this 被 调用 线程 锁定 。 
抛 出 
如 果 有 错误 发 生 ， 抛 出 std: :system_error 类 型 的 异常 。 


std::mutex::try_lock 成 员 函 数 


尝试 为 当前 线程 获取 std: :mutex 对 象 上 的 锁 。 
声明 
bool try lock(); 
前 置 条 件 
调用 线程 不 得 持 有 *#this 上 的 锁 。 
结果 
尝试 为 调用 线程 在 非 阻 塞 的 情况 下 获取 *this 上 的 锁 。 
返回 
如 果 为 调用 线程 获取 到 锁 ， 返 回 true， 和 否则 false。 
后 置 条 件 
如 果 函 数 返 回 true， 则 *this 被 调用 线程 锁定 。 
抛 出 
Fis 


注意 : 即使 没有 其 他 的 线程 持 有 *this 上 的 锁 ， 
锁 失 败 ( 并 返回 false) 。 


std::mutex::unlock 成 员 函 数 
释放 当前 线程 持 有 的 std: :mutex 对 象 上 的 锁 。 
声明 
void undock i); 
前 置 条 件 
调用 线程 必须 持 有 *#this 上 的 锁 。 


函数 也 可 能 获取 


ar 
zh 


释放 当前 线程 持 有 的 *this 上 的 锁 。 如 果 有 被 阻塞 的 线程 正 等 待 获取 *this 
上 的 锁 ， 则 对 其 解除 阻塞 。 


抛 出 
无 。 


D.5.2 std::recursive mutex 类 


std: :recursive_mutex 类 为 线程 提供 了 基本 的 互 斥 和 同步 机 制 ， 可 用 来 保 
护 共 享 数据 。 在 访问 互 斥 元 所 保护 的 数据 之 前 ， 该 互 斥 元 必须 通过 调用 lock() 
或 try_lock() 来 锁定 。 在 同一 时 刻 仅 有 一 个 线程 可 以 持 有 这 个 锁 ， 如 果 另 一 个 
线程 也 试图 锁定 此 recursive_mutex， 就 会 失败 或 被 适当 地 阻塞 。 一 旦 线程 完成 
了 访问 共享 数据 ， 它 必须 接着 调用 unlock( ) 来 释放 锁 ， 并 允许 其 他 线程 获得 它 。 


这 里 的 互 斥 元 是 递归 的 〈recursive) ， 因 此 持 有 在 特定 
std: :recursive_mutex 上 锁 的 线程 可 以 进一步 调用 lock() 或 try_lock() 来 增 
加 锁定 计数 值 。 该 互 斥 元 不 能 被 另外 的 线程 锁定 ， 直 到 获得 锁 的 线程 为 每 个 对 
lock() 和 try_lock() 的 成 功 调用 都 调用 过 一 次 unlock()。 


std: :recursive_mutex 满 足 Lockable 的 需求 。 


class recursive mutex 


public: 
recursive_mutex(recursive_mutex const&)-delete; 
recursive mutex& operator=(recursive_mutex const&)=delete; 


recursive_mutex{} noexcept; 
~recursive_mutex() ; 


void lock(); 

void unlock(); 

bool try locki) noexcept: 
): 


std::recursive mutex 默 认 构 造 函数 


构造 std: :recursive_mutex 对 象 。 


声明 


recursive mutex{) noexcept; 


结果 

构造 std: :recursive_mutex 实 例 。 

后 置 条 件 

新 构造 的 std: :recursive_mutex 对 象 初始 是 未 锁定 的 。 
抛 出 


如 果 不 能 创建 新 的 std: :recursive_mutex 实 例 ， 则 抛 出 


std::system error 类 型 的 异常 。 
std::recursive mutexJ 44 FK Zr 
销毁 std: :recursive_mutex 对 象 。 
声明 
~recursive mutex() ; 
前 置 条 件 
*this 不 得 被 锁定 。 
结果 
销毁 *this。 
抛 出 
Hes 
std::recursive_mutex::lock/ i PK BL 
为 当前 线程 获取 在 std: :recursive_mutex 对 象 上 的 锁 。 
声明 
void lock(); 
结果 


阻 竖 当前 线程 ， 直 到 能 够 获得 *this 上 的 锁 。 
后 置 条 件 


*this 被 调用 线程 锁定 。 如 果 调用 线程 已 经 持 有 *this 上 的 锁 ， 则 锁 计数 值 
增加 一 。 


抛 出 
如 果 有 错误 发 生 ， 抛 出 std: :system_error 类 型 的 异 
std::recursive_mutex::try_lock 成 员 函 数 


尝试 为 当前 线程 获取 std: :recursive_mutex 对 象 上 的 锁 。 


声明 
bool try lock() noexcept; 
结果 
党 试 为 调用 线程 在 非 阻塞 的 情况 下 获取 *this 上 的 锁 。 
返回 
如 果 为 调用 线程 获取 到 锁 ， 返 回 true， 人 否则 false。 
后 置 条 件 
如 果 函 数 返回 true， 则 已 经 为 调用 线程 获取 了 新 的 *this 上 的 锁 。 
抛 出 
无 。 


TEM: 如 果 调 用 线程 已 经 持 有 了 *#this 上 的 锁 ， 函 数 返回 
true， 且 调用 线程 持 有 的 *this 上 锁 的 计数 值 增加 1。 如 果 当 前 线程 
并 未 持 有 *this 上 的 锁 ， 即 使 没有 其 他 的 线程 持 有 *this 上 的 锁 ， 函 
数 也 可 能 获取 锁 失 败 〈 并 返回 false) 。 


std::recursive_mutex::unlock 成 员 函 数 
释放 当前 线程 持 有 的 std: :recursive_mutex 对 象 上 的 锁 。 
声明 
void unlock(); 
前 置 条 件 
调用 线程 必须 持 有 *#this 上 的 锁 。 
结果 
释放 当前 线程 持 有 的 *this 上 的 锁 。 如 果 这 是 调用 线程 所 持 有 的 最 后 一 个 
那么 大 有 被 阻塞 的 线程 正 等 竺 获取 *this 上 的 锁 ， 则 对 其 解除 阻 
后 置 条 件 
调用 线程 持 有 的 *this 上 的 锁 的 计数 值 减 一 。 
抛 出 
Tes 


D.5.3 std::timed mutexZ5 


std: :mutex 提 供 了 基本 的 互 斥 与 同步 机 制 ， 在 此 之 上 ，std: :timed_mutex 
类 为 带 超时 的 锁 提 供 了 文 持 。 在 访问 由 互 斥 元 保护 的 数据 之 前 ， 该 互 斥 元 必须 通 
过 调用 lock()、try_1lock()、try_1lock for() 或 try_ lock_until() 来 进行 锁 
定 。 如 果 已 经 有 别 的 进程 持 有 了 锁 ， 那 么 试图 获取 锁 就 会 有 下 面 几 种 情况 失败 


(try_lock()) ， 阻 塞 直 到 锁 能 够 被 获取 Clock()) ， 阻 塞 直到 锁 能 被 获取 或 
者 尝试 锁定 超时 (try_lock_for() 或 try_lock_until()) 。 一 旦 获得 了 锁 


(不 管 是 用 哪个 函数 获取 到 的 ) ， 在 其 他 线程 可 以 在 互 斥 元 上 获得 该 锁 之 前 ， 都 


必须 调用 unlock( ) 来 释放 它 。 
std: :timed_mutex 满 足 TimedLockable 的 需求 。 


class timed_mutex 


public: 
timed_mutex(timed_mutex const&) =delete; 
timed mutex& operator=(timed_mutex const&) =delete; 


timed mutex (); 
~timed_mutex () ; 


void lock(); 
void unlock (); 
bool try_lock(); 


template<typename Rep, typename Period> 
bool try lock for( 
std::chrono::duration«Rep,Period» const& relative time); 


template<typename Clock,typename Duration» 
bool try lock until( 
std::chrono::time point«Clock,Duration» const& absolute time); 
s 
std::timed_mutex 默 认 构造 函数 
构造 std: :timed_mutex 对 象 。 
声明 
timed mutexí); 
结果 
构造 std: :timed_mutex 实 例 。 
后 置 条 件 
新 构造 的 std: :timed_mutex 对 象 初始 是 未 锁定 的 。 
30 tH 


如 果 不 能 创建 新 的 timed_mutex 实 例 ， 则 抛 出 std: :system_error 类 型 的 异 


std::timed_mutex 析 构 函 数 
销毁 std: :timed_mutex 对 象 。 


声明 


~timed mutex(í); 
前 置 条 件 
*this 不 得 被 锁定 。 
2 
销毁 *this。 
抛 出 
Je 
std::timed_mutex::lock 成 员 函 数 
为 当前 线程 获取 在 std: :timed_mutex 对 象 上 的 锁 。 
声明 
vöid LOCGk(): 
前 置 条 件 
调用 线程 不 得 持 有 *this 上 的 锁 。 
结果 
阻塞 当前 线程 ， 直 到 能 够 获得 *this 上 的 锁 。 
后 置 条 件 
*this 被 调用 线程 锁定 。 
抛 出 
如 果 有 错误 发 生 ， 抛 出 std: :system_error 类 型 的 异常 。 
std::timed_mutex::try_lock 成 员 函 数 
尝试 为 当前 线程 获取 std: :mutex 对 象 上 的 锁 。 
声明 


bool try lockí); 


前 置 条 件 

调用 线程 不 得 持 有 *#this 上 的 锁 。 

结果 

尝试 为 调用 线程 在 非 阻 塞 的 情况 下 获取 *this 上 的 锁 。 
返回 

如 果 为 调用 线程 获取 到 锁 ， 返 回 true， 否 则 false。 
后 置 条 件 

如 果 函 数 返回 true， 则 *this 被 调用 线程 锁定 。 

抛 出 

Fas 


注意 : 即使 没有 其 他 的 线程 持 有 *this 上 的 锁 ， 函 数 也 可 能 获取 
锁 失 败 ( 并 返回 false) 。 


std::timed_mutex::try_lock_for 成 员 函 数 
尝试 为 当前 线程 获取 std: :timed_mutex 对 象 上 的 锁 。 
声明 

template<typename Rep,typename Period> 


bool try lock ori 
std::chrono::duration«Rep,Period» const& relative time); 


前 置 条 件 
调用 线程 不 得 持 有 *this 上 的 锁 。 
结 


在 relative_time 指 定 的 时 间 内 ， 党 试 为 调用 线程 获取 *this 上 的 锁 。 如 果 


relative time.count() 为 零 或 负数 ， 此 调用 会 立即 返回 ， 如 同调 用 了 
try_lock() 一 样 。 和 否则 ， 该 调用 会 一 直 阻 塞 ， 直 到 获取 了 锁 或 者 经 过 了 
relative time 所 指定 的 时 间 段 。 


返回 

如 果 为 调用 线程 获得 了 锁 ， 返 回 true， 人 否则 false。 
后 置 条 件 

如 果 函 数 返 回 true， 则 *this 被 调用 线程 锁定 。 
抛 出 

Te 


注意 : 即使 没有 其 他 的 线程 持 有 *this 上 的 锁 ， 函 数 也 可 能 获取 
锁 失 败 〈 并 返回 false) 。 线 程 可 能 会 比 指定 的 时 间 段 阻 寨 更 长 的 时 
间 。 如 果 可 能 的 话 ， 所 经 过 的 时 间 是 有 可 靠 时 钟 来 决定 的 。 


std::timed_mutex::try_lock_until 成 员 函 数 
尝试 为 当前 线程 获取 std: :timed_mutex 对 象 上 的 锁 。 
声明 

template<typename Clock,typename Duration> 


bool try look untill 
std: : chrono: :time_point<Clock,Duration> const& absolute time); 


前 置 条 件 

调用 线程 不 得 持 有 *this 上 的 锁 。 

结果 

在 absolute_time 指 定 的 时 间 之 前 ， 尝 试 为 调用 线程 获取 *this 上 的 锁 。 如 


果 入 口 处 的 absolute time<=Clock: :now()， 此 调用 会 立即 返回 ， 如 同调 用 了 
try_lock() 一 样 。 否 则 ， 该 调用 会 一 直 阻 塞 ， 直 到 获取 了 锁 或 者 Clock: :now() 


返回 等 于 或 晚 于 absolute_time 的 时 间 。 
返回 
如 果 为 调用 线程 获得 了 锁 ， 返 回 true， 否 则 false。 
后 置 条 件 
如 果 函 数 返回 true， 则 *this 被 调用 线程 锁定 。 
抛 出 
7s 


注意 : 即使 没有 其 他 的 线程 持 有 *this 上 的 锁 ， 函 数 也 可 能 获取 
锁 失败 (并 返回 false〉 。 调 用 线程 将 会 被 阻塞 多 长 时 间 是 没有 保证 
的 ， 除 非 函数 返回 false 然 后 Clock: :now() 返 回 等 于 或 晚 于 
absolute_time 的 时 间 ， 在 这 时 线程 才能 解除 阻 罕 。 


std::timed_mutex::unlock 成 员 函 数 
释放 当前 线程 持 有 的 std: :timed_mutex 对 象 上 的 锁 。 
声明 
void unlock i); 
前 置 条 件 
调用 线程 必须 持 有 *#this 上 的 锁 。 
结果 


释放 当前 线程 持 有 的 *this 上 的 锁 。 如 果 有 被 阻 竖 的 线程 正 等 待 获取 *this 


上 的 锁 ， 则 对 其 解除 阻塞 。 
后 置 条 件 
*this 不 再 被 调用 线程 锁定 。 


抛 出 
无 。 


D.5.4 std::recursive timed, mutex2$ 


std: :recursive_mutex 提 供 了 基本 的 互 斥 与 同步 机 制 ， 在 此 之 
上 ，std: :recursive timed _mutex 类 为 带 超时 的 锁 提 供 了 支持 。 在 访问 由 互 斥 
元 保护 的 数据 之 前 ， 该 互 斥 元 必须 通过 调 
Hjlock(). try lock(). try lock for() 或 try_lock_until() 来 进行 锁定 。 
如 果 已 经 有 别 的 进程 持 有 了 锁 ， 那 么 试图 获取 锁 就 会 有 下 面 儿 种 情况 失败 
(try_lock()) ， 阻 塞 直 到 锁 能 够 被 获取 Clock()) ， 阻 塞 直到 锁 能 被 获取 或 
者 尝试 锁定 超时 Ctry lock for()2ktry lock until()) 。 一 旦 获得 了 锁 
(不 管 是 用 哪个 函数 获取 到 的 ) ， 在 其 他 线程 可 以 在 互 斥 元 上 获得 该 锁 之 前 ， 都 
必须 调用 unlock() 来 释放 它 。 


这 里 的 互 斥 元 是 递归 的 ， 因 此 持 有 在 特定 std: :recursive timed mutex 上 
锁 的 线程 可 以 通过 任意 的 锁 函 数 来 玲 加 地 锁定 该 实例 。 在 其 他 线程 能 够 获取 该 实 
例 的 锁 之 前 ， 所 有 现存 的 锁 都 必须 通过 调用 相应 的 unlock() 进 行 释放 。 


std: :recursive timed _mutex 满 足 TimedLockable 的 需求 。 
class recursive timed mutex 
{ 
public: 


recursive_timed_mutex(recursive_timed_mutex const&)-delete; 
recursive timed mutex& operator=(recursive timed mutex const&)-delete; 


recursive timed mutex(); 
-recursive timed mutex(í); 


void lock(); 
void unlock(); 
bool try lock() noexcept; 


template«typename Rep,typename Period» 
bool try lock for( 
std::chrono: :duration<Rep, Period> const& relative time); 


template«typename Clock,typename Duration» 
bool try lock until( 
std::chrono::time point«Clock,Duration» const& absolute time); 


}; 


std::recursive_timed_mutex 默 认 构 造 函数 


构造 std: :recursive timed _mutex 对 象 。 
声明 
recursive timed mutex() ; 
结果 
构造 std: :recursive_timed_mutex 实 例 。 
后 置 条 件 
新 构造 的 std: :recursive timed _mutex 对 象 初始 是 未 锁定 的 。 
au di 
如 果 不 能 创建 新 的 recursive_timed_mutex 实 例 ， 则 抛 出 


std::system error 类 型 的 异常 。 
std::recursive_timed_mutex 析 构 函 数 
销毁 std: :recursive timed_mutex 对 象 。 
声明 
~recursive timed mutex() ; 
前 置 条 件 
*this 不 得 被 锁定 。 
结果 
销毁 *this。 
抛 出 
无 。 
std::recursive_timed_mutex::lock HK 5i RK Zi 
为 当前 线程 获取 在 std: :recursive timed _mutex 对 象 上 的 锁 。 
声明 


Word Lockia- 


前 置 条 件 

调用 线程 不 得 持 有 *this 上 的 锁 。 

结果 

阻 竖 当前 线程 ， 直 到 能 够 获得 *this 上 的 锁 。 
后 置 条 件 


*this 被 调用 线程 锁定 。 如 果 调用 线程 已 经 持 有 *this 上 的 锁 ， 则 锁 计数 值 
增加 一 。 


抛 出 
如 果 有 错误 发 生 ， 抛 出 std: :system_error 类 型 的 异常 。 
std::recursive_timed_mutex::try_lock 成 员 函 数 


尝试 为 当前 线程 获取 std: :mutex 对 象 上 的 锁 。 


声明 
bool try_lock() noexcept; 
前 置 条 件 
调用 线程 不 得 持 有 *#this 上 的 锁 。 
结果 
尝试 为 调用 线程 在 非 阻 塞 的 情况 下 获取 *this 上 的 锁 。 
返回 
如 果 为 调用 线程 获取 到 锁 ， 返 回 true， 否 则 false。 
后 置 条 件 
如 果 函 数 返回 true， 则 *this 被 调用 线程 锁定 。 
抛 出 


无 。 


注意 : 如 果 调 用 线程 已 经 持 有 了 *#this 上 的 锁 ， 函 数 返回 
true， 且 调用 线程 持 有 的 *+this 上 锁 的 计数 值 增 加 一 。 如 果 当 前 线程 
并 未 持 有 *#this 上 的 锁 ， 即 使 没有 其 他 的 线程 持 有 *#this 上 的 锁 ， 函 
数 也 可 能 获取 锁 失 败 〈 并 返回 false) 。 


std::recursive_timed_mutex::try_lock_for 成 员 函 数 
尝试 为 当前 线程 获取 std: :timed_mutex 对 象 上 的 锁 。 
声明 

template<typename Rep,typename Period> 


bool try lock ifor ( 
std::chrono::duration«Rep,Period» const& relative time); 


前 置 条 件 

调用 线程 不 得 持 有 *this 上 的 锁 。 

结 

在 relative_time 指 定 的 时 间 内 ， 堂 试 为 调用 线程 获取 *this 上 的 锁 。 如 果 
relative time.count() 为 零 或 负数 ， 此 调用 会 立即 返回 ， 如 同调 用 了 
try_lock() 一 样 。 和 否则 ， 该 调用 会 一 直 阻 塞 ， 直 到 获取 了 锁 或 者 经 过 了 
relative_time 所 指定 的 时 间 段 。 

返回 

如 果 为 调用 线程 获得 了 锁 ， 返 回 true， 人 否则 false。 

后 置 条 件 

如 果 函 数 返回 true， 则 *#this 被 调用 线程 锁定 。 

抛 出 

p 


注意 : 即使 没有 其 他 的 线程 持 有 *#this 上 的 锁 ， 函 数 也 可 能 获取 
锁 失 败 〈 并 返回 false) 。 线 程 可 能 会 比 指定 的 时 间 段 阻 寨 更 长 的 时 
间 。 如 果 可 能 的 话 ， 所 经 过 的 时 间 是 有 可 靠 时 钟 来 决定 的 。 


std::recursive_timed_mutex::try_lock_until 成 员 函 数 
尝试 为 当前 线程 获取 std: :timed_mutex 对 象 上 的 锁 。 
声明 


template<typename Clock,typename Duration> 
bool try lock untili 
std::chrono::time point«Clock,Duration» const& absolute time); 


前 置 条 件 

调用 线程 不 得 持 有 *#this 上 的 锁 。 

结果 

在 absolute_time 指 定 的 时 间 之 前 ， 尝 试 为 调用 线程 获取 *this 上 的 锁 。 如 
果 入 口 处 的 absolute time<=Clock: :now()， 此 调用 会 立即 返回 ， 如 同调 用 了 


try_lock() 一 样 。 否 则 ， 该 调用 会 一 直 阻 塞 ， 直 到 获取 了 锁 或 者 Clock: :now() 
返回 等 于 或 晚 于 absolute_time 的 时 间 。 


返回 

如 果 为 调用 线程 获得 了 锁 ， 返 回 true， 人 否则 false。 
后 置 条 件 

如 果 函 数 返回 true， 则 *this 被 调用 线程 锁定 。 
抛 出 

Jas 


注意 : 即使 没有 其 他 的 线程 持 有 *#this 上 的 锁 ， 函 数 也 可 能 获取 


锁 失 败 〈 并 返回 false) 。 调 用 线程 将 会 被 阻塞 多 长 时 间 是 没有 保证 
的 ， 除 非 函 数 返 回 false 然 后 Clock: :now() 返 回 等 于 或 晚 于 
absolute time 的 时 间 ， 在 这 时 线程 才能 解除 阻塞 。 


std::recursive timed mutex::unlock/X 5i pK Zi 
释放 当前 线程 持 有 的 std: :timed_mutex 对 象 上 的 锁 。 
声明 
void unlock(); 
前 置 条 件 
调用 线程 必须 持 有 *#this 上 的 锁 。 
结果 


释放 当前 线程 持 有 的 *this 上 的 锁 。 如 果 有 被 阻塞 的 线程 正 等 待 获取 *this 
上 的 锁 ， 则 对 其 解除 阻塞 。 


后 置 条 件 

*this 不 再 被 调用 线程 锁定 。 
抛 出 

X. 


D.5.5 std::lock_guard 类 模板 


std: :lock_guard 类 模板 提供 了 基本 的 锁 所 有 权 包 装 。 将 要 被 锁定 的 互 斥 元 
类 型 由 模板 参数 Mutex 指 定 ， 且 必须 满足 Lockable 需 求 。 指 定 的 互 斥 元 被 锁定 于 
构造 函数 中 ， 并 被 解锁 于 析 构 函数 中 。 这 就 提供 了 一 个 简单 的 为 一 段 代 码 块 锁定 
一 个 互 斥 元 的 方法 ， 并 且 确 保 当 离 开 代 码 块 的 时 候 互 斥 元 被 解锁 ， 无 论 是 一 次 性 
A 还 是 使 用 诸如 break 或 return 这 样 的 控制 流 语句 ， 或 是 引发 异常 来 达 
成 的 情况 。 


std: :lock_guard 的 实例 不 
是 MoveConstructible、CopyConsstructible 或 CopyAssignable 的 。 


template <class Mutex> 
class lock_guard 


{ 
public: 
typedef Mutex mutex type; 


explicit lock guard (mutex type& m); 
lock guard(mutex type& m, adopt lock t); 
~lock guard(); 


lock guard(lock guard const& ) = delete; 
lock guard& operator-(lock guard const& ) - delete; 


}; 
std::lock_guard 锁 定 构造 函数 
构造 锁定 所 给 互 斥 元 的 std: :lock_guard 实 例 。 
声明 
explicit lock guard (mutex type& m); 
结果 
构造 引用 所 给 互 斥 元 的 std: :lock_guard 实 例 。 调 用 m.1ock()。 
引发 
由 m.lock() 引 发 的 任何 异常 。 
后 置 条 件 
*this 拥 有 在 m 上 的 锁 。 
std::lock_guard 采 纳 锁 定 构造 函数 
构造 拥有 所 给 互 斥 元 上 锁 的 std: :lock_guard 实 例 。 
声明 


lock guard {mutex type& m,std::adopt lock t); 


前 置 条 件 
调用 线程 必须 拥有 在 m 上 的 锁 。 


+ 
zh 


构造 引用 所 给 互 斥 元 的 std: :lock_guard 实 例 ， 并 获取 调用 线程 所 持 有 的 m 
上 的 锁 的 所 有 权 。 


引发 
zs 
后 置 条 件 
*this 拥 有 调用 线程 持 有 的 在 m 上 的 锁 。 
std::lock_guard 析 构 函 数 
销毁 std: :lock_guard 实 例 并 解锁 相应 的 互 斥 元 。 
声明 
~lock guard () ; 
结 
为 *this 构 造 时 所 提供 的 互 斥 元 实例 m 调 用 m.un1lock()。 
引发 


D.5.6 std::unique_lock 类 模板 


std: :unique_lock 类 模板 提供 了 比 std: :lock_guard 更 通用 的 锁 所 有 权 包 
装 。 将 要 被 锁定 的 互 斥 元 类 型 由 模板 参数 Mutex 指 定 ， 且 必须 满足 
BasicLockable 需 求 。 一 般 来 说 ， 指 定 的 互 斥 元 在 构造 函数 中 被 锁定 并 在 析 构 冰 
数 中 被 解锁 ， 尽 管 可 以 提供 额外 的 构造 函数 和 成 员 函 数 来 允许 其 他 的 可 能 性 。 这 
就 提供 了 一 个 简单 的 为 一 段 代 码 块 锁定 一 个 互 斥 元 的 方法 ， 并 且 确 保 当 离开 代码 
块 的 时 候 互 斥 元 被 解锁 ， 无 论 是 运行 到 底 ， 还 是 使 用 诸如 break 或 return 这 样 的 
控制 流 语句 ， 或 是 引发 异常 来 达成 的 。std: :condition _ variable 的 等 待 函 数 
要 求 一 个 std: :unique_lock<std: :mutex> 的 实例 ， 并 且 std: :unique_lock 的 
所 有 实例 化 都 适合 与 std: :condition _ variable_any 等 待 函 数 的 Lockab1le 人 参数 


一 起 使 用 。 


如 果 所 给 的 Mutex 类 型 满足 Lockable 需 求 ， 那 
么 std: :unique_lock<Mutex> 也 满足 Lockable 需 求 。 如 果 在 此 之 外 ， 所 给 的 
Mutex 类 型 满足 TimedLockable 需 求 ， 那 么 std: :unique_lock<Mutex> 也 满足 
TimedLockable 需 求 。 


std: :unique_lock 的 实例 是 MoveConstructible 和 MoveAssignable 的 ， 
但 不 是 CopyConsstructible 或 CopyAssignable 的 。 


template <class Mutex> 
class unique lock 
| 


public: 
typedef Mutex mutex_type; 


unique. lock() noexcept; 

explicit unique lock (mutex type& m); 
unique lock (mutex type& m, adopt lock t); 

unique lock(mutex type& m, defer lock t) noexcept; 
unique lock(mutex type& m, try to lock t); 


template<typename Clock,typename Duration> 
unique_lock ( 
mutex type& m, 
Std::chrono::time point«Clock,Duration» const& absolute time); 


template«typename Rep,typename Period» 
unique lock( 
mutex type&k m, 
std::chrono: :duration<Rep, Period> const& relative time); 


~unique lock(); 


unique lock(unique lock const& ) = delete; 
unique lock& operator-(unique lock const& ) = delete; 


unique lock(unique lock&& ); 
unique lock& operator-í(unique lock&& ); 


void swap(unique lock& other) noexcept; 


void lock(0); 
bool try lock(); 
template<typename Rep, typename Period> 
bool try lock for( 
std::chrono: :duration<Rep, Period> const& relative time); 
template«typename Clock, typename Duration> 
bool try lock until(í 
std::chrono::time point«Clock,Duration» const& absolute time); 
void unlock(); 


explicit operator bool() const noexcept; 
bool owns lock() const noexcept; 

Mutex* mutex() const noexcept; 

Mutex* release() noexcept; 


}; 

std::unique_lock 默 认 构 造 函 数 
构造 没有 相关 联 互 斥 元 的 std: :unique_lock 实 例 。 
声明 

unique lock() noexcept; 
结果 
构造 没有 相关 联 互 斥 元 的 std: :unique_lock 实 例 。 
后 置 条 件 


this->mutex(}==NULL, this-»owns lockí)--false. 
std::unique lock£i zz 44) 14 PR AY 
构造 锁定 所 给 互 斥 元 的 std: :unique_lock 实 例 。 
声明 
explicit unique lock (mutex type& m); 
结 
构造 引用 所 给 互 斥 元 的 std: :unique_lock 实 例 。 调 用 m. lock()。 
后 置 条 件 
this-»owns lock()==true, this-»mutex()--&m. 
std::unique_lock 采 纳 锁定 构造 函数 
构造 拥有 所 给 互 斥 元 上 锁 的 std: :unique_lock 实 例 。 
声明 
unique lock (mutex type& m,std::adopt lock t); 
前 置 条 件 
调用 线程 必须 拥有 在 m 上 的 锁 。 
结果 


构造 引用 所 给 互 斥 元 的 std: :unique_lock 实 例 ， 并 获取 调用 线程 所 持 有 的 m 
上 的 锁 的 所 有 权 。 


引发 
无 。 
后 置 条 件 


this-»owns lock()==true, this-»mutex()--&m. 


std: :unique_lock 2 i8 9E $435 PR Zt 
构造 不 拥有 所 给 互 斥 元 上 锁 的 std: :unique_lock 实 例 。 


声明 
unique lock (mutex type& m,std::defer lock t) noexcept; 
AR 
构造 引用 所 给 互 斥 元 的 std: :unique_lock 实 例 。 
引发 
无 。 
后 置 条 件 
this->owns_lock()==false, this-»mutex(í)--&m. 
std::unique lock: iX 9 XE $438 PAI AL 


构造 与 所 给 互 斥 元 相关 联 的 std: :unique_lock 实 例 ， 并 尝试 获取 该 互 斥 元 
上 的 锁 。 


声明 
unique lock (mutex type& m,std::try to lock t); 
HU ELA TE 
用 来 实例 化 std: :unique_lock 的 Mutex 类 型 必须 满足 Lockable 需 求 。 
结果 
构造 引用 所 给 互 斥 元 的 std: :unique_lock 实 例 。 调 用 m.try_lock()。 
引发 
无 。 
后 置 条 件 


this-»owns lock() 返 回调 用 m.try_lock() 的 结果 ，this- 
>mutex()==&m. 


std::unique_lock 带 有 超时 时 间 段 的 党 试 锁定 构造 函数 
构造 与 所 给 互 斥 元 相关 联 的 std: :unique_lock 实 例 ， 并 尝试 获取 该 互 斥 元 


上 的 锁 。 
声明 


template<typename Rep,typename Period> 
unique lock( 
mutex type& m, 
std::chrono::duration«Rep,Period» const& relative time); 


前 置 条 件 


用 来 实例 化 std: :unique_lock 的 Mutex 类 型 必须 满足 TimedLockable 需 
结 


构造 引用 所 给 互 斥 元 的 std: :unique_lock 实 例 。 调 
用 m.try_lock_for(relative time). 


引发 
无 。 
后 置 条 件 


this->owns_lock() 返 回调 用 m.try_lock_for() 的 结果 ，this- 
>mutex()==&m. 


std::unique_lock 带 有 超时 时 间 点 的 党 试 锁定 构造 函数 


构造 与 所 给 互 斥 元 相关 联 的 std: :unique_lock 实 例 ， 并 尝试 获 取 该 互 斥 元 
上 的 锁 。 
声明 


template<typename Clock,typename Duration> 
unique lock( 
mutex type& m, 
std::chrono::time point«Clock,Duration» const& absolute time); 


前 置 条 件 
用 来 实例 化 std: :unique_lock 的 Mutex 类 型 必须 满足 TimedLockable 需 


结果 


构造 引用 所 给 互 斥 元 的 std: :unique_ lock 实例 。 调 
Him.try lock until(absolute time). 


引发 
无 。 
后 置 条 件 


this-»owns lock() 返 回调 用 m.try_lock_until() 的 结果 ，this- 
>mutex()==&m. 


std::unique_lock 移 动 构造 函数 


将 锁 的 所 有 权 从 一 个 std: :unique_lock 对 象 转移 到 新 创建 的 
std: :unique_lock 对 象 。 


声明 
unique lock(unique lock&& other) noexcept; 
结果 


构造 std: :unique_1lock 实 例 。 如 果 other 在 调用 构造 函数 前 拥有 互 斥 元 上 
的 锁 ， 该 锁 现 在 由 新 建立 的 std: :unique_lock 对 象 所 有 。 


后 置 条 件 

对 于 新 构造 的 std: :unique_lock 对 象 x，x.mutex() 等 于 调用 该 构造 函数 前 
的 other .mutex() 值 ， 且 x.owns_ lock() 等 于 调用 该 构造 函数 
前 other .owns_1lock() 的 
值 。other .mutex()==NULL，other.owns_1lock()==false。 

引发 


无 。 


注 std::unique_lock 对 象 不 是 CopyConstructible 的 ， 所 
有 没有 拷贝 构造 函数 ， 只 有 这 个 移动 构造 函数 。 


std::unique_lock 移 动 赋值 运算 符 


将 锁 的 所 有 权 从 一 个 std: :unique_lock 对 象 转移 到 男 一 
“std: :unique_lock 对 象 。 


声明 
unique lock& operator-(unique lock&& other) noexcept; 
结果 


如 果 this->owns_lock() 在 此 调用 前 返回 true， 调 用 this->unlock。 如 果 
other 在 此 赋值 之 前 拥有 在 互 斥 元 上 的 锁 ， 该 锁 现 在 由 *this 所 有 。 


后 置 条 件 
this->mutex() 等 于 调用 此 赋值 前 的 other .mutex() 值 ， 且 this- 
>owns_lock() 等 于 调用 此 赋值 前 other.owns_lock() 的 
值 。other .mutex()==NULL，other.owns lock()--false. 
引发 


无 。 


注 std::unique_lock 对 象 不 是 CopyConstructible 的 ， 所 
有 没有 拷贝 赋值 运算 符 ， 只 有 这 个 移动 赋值 运算 符 。 


std::unique_lock 析 构 函 数 


销毁 std: :unique_lock 实 例 并 解锁 相应 的 互 斥 元 ， 如 果 它 由 被 销毁 的 实例 
所 持 有 。 


声明 
~unique lock(); 


结果 


如 果 this->owns_lock() 返 回 true， 调 用 this->mutex()->unlock()。 
引发 
Jáe 

std::unique lock::swap/X 5i RA Zi 


在 两 个 std: :unique_lock 对 象 之 间 交 换 它 们 相关 联 的 unique_lock 的 所 有 
权 。 


声明 
void swap(unique lock& other) noexcept; 


an 
结 


如 果 other 在 调用 之 前 拥有 互 斥 元 上 的 锁 ， 该 锁 现 在 由 *this 所 有 。 

如 果 *this 在 调用 之 前 拥有 互 斥 元 上 的 锁 ， 该 锁 现 在 由 other 所 有 。 

后 置 条 件 

this->mutex() 与 调用 前 other .mutex() 的 值 相等 。other.mutex() 与 调用 
前 this->mutex() 的 值 相 等 。this->owns_lock() 与 调用 
前 other .owns_lock() 的 值 相等 。other.owns_lock() 与 调用 前 this- 
>owns_lock( ) 的 值 相等 。 

引发 

无 。 
swap 非 成 员 函 数 


在 两 个 std: :unique_lock 对 象 之 间 交 换 它 们 相关 联 的 unique_lock 的 所 有 
权 。 


声明 

void swap(unique lock& lhs,unique lock& rhs) noexcept; 
结果 

lhs.swap (rhs) 


引发 
无 。 

std::unique_lock::lock 成 员 函 数 
获取 与 *this 相 关联 的 互 斥 元 上 的 锁 。 
声明 

void lockt); 
前 置 条 件 
this->mutex()!=NULL, this->owns_lock()==false. 
结果 
调用 this->mutex()->lock()。 
引发 


任何 由 this->mutex()->lock() 引 发 的 异常 。 如 果 this- 
>mutex()==NULL， 引 发 带 有 std: :errc: :operation_not_permitted 错 误 码 的 
std: :system_error 异 常 。 如 果 在 条 目 上 this->owns_lock()==true， 引 发 带 
有 std: :errc::resource_deadlock_would_occur 错 误 码 的 
std::system error. 


后 置 条 件 
this->owns_lock()==true. 
std::unique_lock::try_lock/ 5i ei 2X 
试图 获取 与 *this 相 关联 的 互 斥 元 上 的 锁 。 
声明 
bool try Tock} 3 
前 置 条 件 


用 来 实例 化 std: :unique_lock 的 Mutex 类 型 必须 满足 Lockable 需 
求 。this->mutex()!=NULL, this-»owns lock()--false. 


结果 
调用 this->mutex()->try_lock()。 
返回 


如 果 对 this_mutex()->try_lock() 的 调用 返回 true， 则 返回 true， 人 否 
则 false。 


引发 


任何 由 this->mutex()->try_lock() 引 发 的 异常 。 如 果 this- 
>mutex()==NULL， 引 发 带 有 std: :errc::operation_not_permitted 错 误 码 的 
std: :system_error 异 常 。 如 果 在 条 目 上 this->owns_lock()==true， 引 发 带 
有 std::errc: :resource deadlock_would_occur 错 误 人 码 的 
std::system error. 


后 置 条 件 


如 果 函 数 返 回 true，this->owns_lock()==true， 和 否则 this- 
»owns lock()--false. 


std::unique lock::unlock SK 5i FA% 
TER 5 *thisTHOX EXE] H. Fe 7o E]. 
声明 
void unlock íi); 
前 置 条 件 
this->mutex()!=NULL, this-»owns lock()--true. 
结果 
调用 this->mutex()->unlock()。 
引发 


任何 由 this->mutex()->unlock() 引 发 的 异常 。 如 果 在 条 目 上 this- 
»owns lock()--false, 5l fistd::errc::operation _not_permitted 错 
误 码 的 std: :system_error 异 常 。 


后 置 条 件 


this->owns_lock()==false. 
std::unique_lock::try_lock_for hk 5i A Zi 

在 指定 时 间 内 试图 获取 与 *this 相 关联 的 互 斥 元 上 的 锁 。 

声明 


template<typename Rep, typename Period- 
bool try lock fort 
std::chrono::duration«Rep,Period» const& relative time) ; 


前 置 条 件 


用 来 实例 化 std: :unique_lock 的 Mutex 类 型 必须 满足 Lockable 需 
求 。this->mutex()!=NULL, this-»owns lock()--false. 


结果 
WjHjthis-»mutex()-»try lock for(relative time). 
返回 


如 果 对 this_mutex()->try_lock for() 的 调用 返回 true， 则 返回 true， 
否则 false。 


引发 


任何 由 this->mutex()->try_lock_for() 引 发 的 异常 。 如 果 this- 
>mutex()==NULL， 引 发 带 有 std: :errc: :operation not_permitted 错 误 码 的 
std: :system_error 异 常 。 如 果 在 条 目 上 this->owns_lock()==true， 引 发 带 
^Hstd::errc::resource deadlock_would_occur 错 误 人 码 的 
std: :system_error#: ii © 


后 置 条 件 


如 果 函 数 返 回 true，this->owns_lock()==true， 和 否则 this- 
>owns_lock()==false. 


std::unique_lock::try_lock_until ik 5i PK Zt 
在 指定 时 间 内 试图 获取 与 *this 相 关联 的 互 斥 元 上 的 锁 。 


声明 


template<typename Clock, typename Duration> 
bool try lock until ( 
std::chrono::time point«Clock,Duration» const& absolute time); 


前 置 条 件 


用 来 实例 化 std: :unique_lock 的 Mutex 类 型 必须 满足 Lockable 需 
求 。this->mutex()!=NULL, this-»owns lock()--false. 


结果 
调用 this->mutex()->try_lock_until(absolute time). 
返回 


如 果 对 this_mutex()->try_lock_until() 的 调用 返回 true， 则 返回 
true， 人 否则 false。 


引发 


任何 由 this->mutex()->try_lock_until() 引 发 的 异常 。 如 果 this- 
>mutex()==NULL， 引 发 带 有 std: :errc::operation_not_permitted 错 误 码 的 
std: :system_error 异 常 。 如 果 在 条 目 上 this->owns_lock()==true， 引 发 带 
^Hstd::errc::resource deadlock_would_occur 错 误 人 码 的 
std::system error. 


后 置 条 件 


如 果 函 数 返 回 true，this->owns_lock()==true， 和 否则 this- 
>owns_lock()==false. 


std::unique lock::operator bool ik 5i P AL 
检查 *this 是 否 拥 有 互 斥 元 上 的 锁 。 
声明 
explicit operator bool () const noexcept ; 


返回 


this-»owns lock(). 


引发 


注 “ 这 是 运算 符 的 exp1icit 版 本 ， 因 此 它 仅 仅 在 结果 被 用 作 布 
尔 量 且 不 会 被 视 为 整 型 值 8 或 1 的 上 下 文中 才 会 被 隐 式 地 调用 。 


std::unique lock::owns lockJX 7i PK Zt 
检查 *this 是 否 拥 有 互 斥 元 上 的 锁 。 
声明 


bool owns_lock() const noexcept; 


返回 
如 果 *this 拥 有 互 太 元 上 的 锁 ， 返 回 true， 人 否则 false。 
引发 
无 。 


std::unique_lock::mutex 成 员 函 数 
返回 与 *this 相 关联 的 互 斥 元 ， 如 果 有 的 话 。 
声明 


mutex type* mutex() const noexcept; 


返回 

如 果 *this 有 相关 联 的 互 斥 元 ， 返 回 指 同 它 的 指针 ， 否 则 返回 NULL。 
引发 

Fs 


std::unique_lock::release 成 员 函 数 


返回 与 *this 相 关联 的 互 斥 元 ， 如 果 有 的 话 ， 并 且 释 放 该 关联 。 
声明 
mutex type* release() noexcept; 
结果 
靳 开 互 斥 元 与 *this 的 关联 ， 并 不 解锁 持 有 的 任何 锁 。 
返回 
如 果 *this 有 相关 联 的 互 斥 元 ， 返 回 指 回 它 的 指针 ， 人 否则 返回 NULL。 
后 置 条 件 
this->mutex()==NULL, this->owns_lock()==false. 
引发 
无 。 


注 ” 如 果 this->owns_lock() 在 调用 前 返回 true， 调 用 者 现在 
对 解锁 该 互 斥 元 负责 。 


D.5.7 std::lock K Zi f f 


std: : lock 函数 模板 提供 了 同时 锁定 多 于 一 个 互 斥 元 的 方法 ， 避 免 了 在 不 一 
致 的 锁 顺 序 下 的 死 锁 结果 风险 。 

声明 
template«typename LockableTypel, typename... LockableType2> 
void lock (LockableTypel& ml,LockableType2& m2...); 


前 置 条 件 


所 给 的 可 锁定 对 象 LockableTypel1、LockableType2 等 类 型 必须 满足 
Lockable 需 求 。 


结果 


在 每 个 所 给 的 可 锁定 对 象 n1、m2 等 上 获取 锁 ， 通 过 未 指定 的 顺序 来 调用 那些 
类 型 的 lock()、try_lock() 和 unlock() 来 避免 死 锁 。 


后 置 条 件 
当前 线程 拥有 每 个 所 给 顶 的 可 锁定 对 象 上 的 锁 。 
引发 


调用 lock()、try_lock() 和 unlock() 时 引发 的 任何 异常 。 


YE ”如果 异 常 从 std: :lock 的 调用 中 传播 出 来 ， 那 么 在 本 函数 
中 所 有 已 经 通过 调用 lock() 或 try_ lock() 获 取 锁 的 对 象 nL、m2 
等 ， 都 必须 为 其 调用 unlock() 。 


D.5.8 std::try lock 函数 模板 


std: :try_lock 函 数 模 板 允 许 你 尝试 着 一 次 性 锁定 一 系列 的 可 锁定 对 象 ， 
此 它们 可 能 全 都 被 锁定 也 可 能 都 没有 被 锁定 。 


声明 


template<typename LockableTypel,typename... LockableType2> 
int try lockí(LockableTypel& ml,LockableType2& m2...) ; 


前 置 条 件 


所 给 的 可 锁定 对 象 LockableTypel1、LockableType2 等 类 型 必须 满足 
Lockable 需 求 。 


结果 
尝试 在 每 个 所 给 的 可 锁定 对 象 n1、m2 等 上 获取 锁 ， 通 过 逐个 轮流 调 


用 try_lock()。 如 果 一 个 对 try_lock() 的 调用 返回 false 或 引发 异常 ， 已 经 获 
取 的 锁 通 过 在 对 应 的 可 锁定 对 象 上 调用 unlock() 来 释放 。 


返回 


如 果 所 有 的 锁 都 获取 到 “每 次 调用 try_lock() 都 返回 true) ， 返 回 -1， 否 
则 返回 调用 try_lock() 返 回 false 的 对 象 的 基于 零 的 索引 。 


后 置 条 件 


如 果 函 数 返 回 -1， 当 前 线程 拥有 每 个 押 提 供 的 可 锁定 对 象 上 的 锁 。 否 则 ， 该 
调用 所 有 已 获取 的 锁 都 已 被 释放 。 


引发 
调用 try_lock() 时 引发 的 任何 异常 。 


注 “ 如 果 异 常 从 std: :try_lock 的 调用 中 传播 出 来 ， 那 么 在 本 
函数 中 所 有 已 经 通过 调用 try_lock( ) 获 取 锁 的 对 象 n1、m2 等 ， 都 必 
须 为 其 调用 unlock()。 


D.5.9 std::once_flag 类 
std: :once_flag 的 实例 与 std: :call_once 一 起 使 用 ， 以 确保 特定 的 函数 被 
严格 地 调用 一 次 ， 即 便 有 多 个 线程 同时 执行 调用 。 


std::once flag 的 实例 不 
是 CopyConstructible、CopyAssignable、MoveConstructible 和 
MoveAssignable 的 。 


struct once flag 
{ 
constexpr once flag{) noexcept; 
once flag(once flag const& } = delete; 
once flag& operator-(once flag const& ) - delete; 


): 


std::once_flag 默 认 构 造 函 数 


std: :once_flag 默 认 构 造 函 数 构造 新 的 std: :once_flag 实 例 ， 其 状态 指示 
了 所 关联 的 函数 尚未 被 调用 。 


声明 
constexpr once flag() noexcept; 

结 

构造 新 的 std: :once_flag 实 例 ， 其 状态 指示 了 所 关联 的 函数 尚未 被 调用 。 


因为 这 是 一 个 constexpr 构 造 函 数 ， 带 有 静态 存储 时 间 段 的 实例 作为 静态 初始 化 
阶段 的 一 部 分 被 构造 ， 这 避免 了 竞争 条 件 和 初始 化 顺序 问题 。 


D.5.10 std::call oncerK Zi fx 

std::call oncejstd::once flag 一 起 使 用 ， 以 确保 特定 的 函数 被 严格 地 
调用 一 次 ， 即 便 有 多 个 线程 同时 执行 调用 。 

声明 


template<typename Callable,typename... Args> 
void call once(std::once flag& flag,Callable func,Args args...); 


前 置 条 件 


对 给 定 的 func 和 args 值 ， 表 达 式 INVOKE(func,args) 有 效 。Callable 和 
Args 的 每 个 成 员 都 是 MoveConstructible 的 。 


结果 


在 同一 个 std: :once_flag 对 象 上 的 std: :call_once 调 用 被 序列 化 。 如 果 在 
同一 个 std: :once_flag 对 象 上 之 前 没有 过 有 效 的 std: :call_once 调 用 ， 参 
数 func〔 或 其 副本 )〉 如 同 通过 INVOKE(func,args) 那 样 被 调用 ， 并 
且 std: :cal1l_once 的 调用 有 效 当 且 仅 当 func 的 调用 返回 而 无 异常 。 如 果 在 同一 
个 std: :once_flag 对 象 上 之 前 有 过 有 效 的 std: :call_once， 对 
std: :call_once 的 调用 会 返回 而 不 执行 func。 


同步 


在 std: :once_flag 对 象 上 有 效 的 std: :call_once 调 用 的 完成 ， 发 生 于 在 同 
一 个 std: :once_flag 对 象 上 所 有 接 下 来 的 std: :call_once 调 用 之 前 。 


引发 
当 结 果 无 法 达到 或 从 func 的 调用 中 传播 出 任何 异种 时 ， 引 发 


std::system error. 


D.6 ”<ratio> 头 文件 
<ratioy 头 文件 提供 了 对 编译 时 有 理 数 数学 运算 的 支持 。 
头 文件 内 容 


namespace std 


{ 


template<intmax_t N,intmax_t D=1> 
clase ratio; 


// ratio arithmetic 
template «class R1, class R2» 
using ratio add = see description; 


template «class R1, class R2» 
using ratio subtract - see description; 


template «class R1, class R2» 
using ratio multiply - see description; 


template «class R1, class R2» 
using ratio divide - see description; 


// ratio comparison 


template «class R1, class R2» 
struct ratio equal; 

template «class R1, class R2» 
struct ratio not equal; 
template «class R1, class R2> 
struct ratio less; 

template <class R1, class R2> 
struct ratio less equal; 
template <class R1, class R2> 


struct ratio_greater; 


template <class R1, 


class R2> 


struct ratio greater equal; 


typedef 
typedef 
typedef 
typedef 
typedef 
typedef 
typedef 
typedef 
typedef 
typedef 
typedef 
typedef 
typedef 
typedef 
typedef 
typedef 


ratios i, 
ratio<1, 
ratio<l, 
ratio<1, 
ratio<1, 
ratios; 
ratio<l, 
ratio«1, 
ratio<10, 
ratio<100, 1> hecto; 

ratio<1000, 1> kilo; 
ratio«1000000, 1» mega; 
ratio«1l1000009000, 1> giga: 
ratio«1000000000000, 1» tera; 
ratio«1000000000000000, 1» peta; 
ratio«1000000000000000000, 1» exa; 


1000000000000000000» atto; 
1000000000000000» femto; 
1000000000000» pico; 
1000000000» nano; 
1000000» micro; 

1000» milli; 

100» centi: 

10» deci; 

1» deca; 


D.6.1 std::ratio 类 模板 


std: : ratio 类 模板 为 编译 时 算法 提供 了 一 套 机 制 ， 包 括 诸 如 二 分 之 一 
(std::ratio«1,2») 、 三 分 之 二 (std::ratio«2,3») 或 四 十 三 分 之 十 五 
(std::ratio«15,43») 这 样 的 有 理 数 值 。 在 C++ 标准 库 中 它 被 用 来 在 实例 
化 std: : chrono: :duration 类 模板 时 指定 时 间 间 隔 。 


template <intmax_t N, intmax_t D = 1> 

class ratio 

public: 
typedef ratio<num, den> type; 
static constexpr intmax_t num= see below; 
static constexpr intmax t den= see below; 
DN EAS 
描述 


num 和 den 是 分 数 WD 约 分 到 最 简 的 分 子 和 分 母 。den 永 远 为 正 数 。 如 果 N 和 D 符 
号 相同 ，num 是 正 的 ;否则 num 是 负 的 。 


示例 


ratio<4,6>::num == 2 
ratio<4,6>::den == 3 
ratio<4,-6>::num == -2 
ratio<4,-6>::den == 3 


D.6.2 std::ratio_add 模 板 别 名 


std: :ratio_add 模 板 别 名 提供 了 在 编译 时 将 两 个 std: : ratio 值 相 加 的 机 
制 ， 使 用 有 理 数 算法 。 


定义 


template <class R1, class R2> 
using ratio add = std::ratio«see below»; 


前 置 条 件 

R1 和 R2 必 须 是 std: :ratio 类 模板 的 实例 化 。 

结果 

ratio_add<R1,R2> 被 定义 为 std: :ratio 实 例 的 一 个 别名 ， 它 表示 了 由 R1 和 
R2 所 代表 的 分 数 之 和 ， 如 果 它 们 的 和 可 以 没有 溢出 地 计算 出 来 。 如 果 结 果 计 算 洲 
出 ， 程 序 就 是 病态 的 。 在 没有 算法 溢出 的 情况 下 ，std: : ratio_add<R1,R2> 应 
当 拥 有 和 


std: :ratio<R1: :num*R2: :den«R2: :num*R1: : den, R1: :den*R2: :den> 相 同 的 
num 和 den 值 。 


示例 
std::ratio add«estd::ratio«l1,35, std::ratio«2,5» »i:num == 11 
std: :ratio add<std: :ratio<1,3>, std::ratio<2,5> >::den == 15 
std::ratio_add<std::ratio<1,3>, std::ratio<7,6> »::num == 3 
std::ratio add<std::ratio<1,3>, std::ratio«7,6» >::den == 2 


D.6.3 std::ratio_subtract#2 iK 9l] 4 


std: :ratio_add 模 板 别 名 提供 了 在 编译 时 将 两 个 std: : ratio 值 相 减 的 机 
制 ， 使 用 有 理 数 算法 。 


定义 
template <class R1, class R2> 
using ratio subtract = std::ratio«see below»; 


前 置 条 件 

R1 和 R2 必 须 是 std: : ratio 类 模板 的 实例 化 。 

结果 

ratio_subtract<R1,R2> 被 定义 为 std: :ratio 实 例 的 一 个 别名 ， 它 表示 了 
由 RI 和 R2 所 代表 的 分 数 之 差 ， 如 果 它们 的 差 可 以 没有 溢出 地 计算 出 来 。 如 果 结 果 


计算 溢出 ， 程 序 就 是 病态 的 。 在 没有 算法 溢出 的 情况 
下 ，std: :ratio_subtract<R1,R2> 应 当 拥 有 和 


std: :ratio<R1: :num*R2: :den-R2: :num*R1: : den, R1: : den*R2: :den> 相 同 的 
num 和 den 值 。 


示例 
std: :ratio_subtract<std: :ratio<1,3>, std::ratio<1,5> >::num == 2 
std: :ratio subtract<std::ratio<1,3>, std::ratio<1,5> 24 rdén == T5 
std: :ratio subtract«std::rstiosl1,35, std::ratio<7,6> >»::num == -5 
std: :ratio subtract«std::ratio«1,3», std::ratio«7,6» >::den == 6 


D.6.4 std::ratio_multiply# f 5! 4 


std: :ratio_multiply 模 板 别 名 提供 了 在 编译 时 将 两 个 std: :ratio 值 相 乘 
的 机 制 ， 使 用 有 理 数 算法 。 

定义 
template <class R1, class R2> 
using ratio multiply = std::ratio«see below»; 


前 置 条 件 
R1 和 R2 必 须 是 std: :ratio 类 模板 的 实例 化 。 
结果 


ratio_multiply<R1,R2> 被 定义 为 std: :ratio 实 例 的 一 个 别名 ， 它 表示 了 
由 R1 和 R2 所 代表 的 分 数 之 积 ， 如 果 它 们 的 积 可 以 没有 溢出 地 计算 出 来 。 如 果 结 果 
计算 溢出 ， 程 序 就 是 病态 的 。 在 没有 算法 溢出 的 情况 
下 ，std: :ratio _multiply<R1,R2> 应 当 拥 有 和 
std: :ratio<R1: :num*R2: :num, R1: :den*R2: :den> 相 同 的 num 和 den 值 。 


示例 
std: :ratio multiply<std: :ratio<1,3>, std::ratio<2,5> »::num == 
std: :ratio multiply<std: :ratio<1,3>, std::ratio<2,5> >::den == 15 
std: :ratio multiply<std: :ratio<l1,3>, std::ratio<15,7> >::num == 5 
std: :ratio multiply<std: :ratio<1,3>, std::ratio«15,7» »::den == 7 


D.6.5 std::ratio_dividet fx 5!) 4 


std::ratio divide 模 板 别名 提供 了 在 编译 时 将 两 个 std: : ratio 值 相 除 的 


机 制 ， 使 用 有 理 数 算法 。 
定义 


template <class R1, class R2> 
using ratio divide = std::ratio<see below>; 


前 置 条 件 
R1 和 R2 必 须 是 std: :ratio 类 模板 的 实例 化 。 
结果 


ratio_multiply<R1,R2> 被 定义 为 std: :ratio 实 例 的 一 个 别名 ， 它 表示 了 
由 R1 和 R2 所 代表 的 分 数 相 除 的 结果 ， 如 果 此 结果 可 以 没有 溢出 地 计算 出 来 。 如 果 
结果 计算 洪 出 ， 程 序 就 是 病态 的 。 在 没有 算法 溢出 的 情况 
下 ，std::ratio divide<R1,R2> 应 当 拥 有 和 
std: :ratio«R1::num*R2: :den, R1: :den*R2: :num> 相 同 的 num 和 den 值 。 


示例 
std::ratio dividecstd:'rdtlocl,35, Std::ratio<2,5> >::num == 5 
std: :ratio divide<std: :ratio<1,3>, std::ratio<2,5> >::den == 6 


std: :ratio divide<std::ratio<],3>, std::ratio<15,7> >::num == 
std: :ratio divide«std::ratio«sl1,3»5, std::ratio<15,7> >::den == 45 


D.6.6 std::ratio_equal 类 模板 


std::ratio equal 类 模板 提供 了 在 编译 时 比较 两 个 std: :ratio 值 是 否 相等 
的 机 制 ， 使 用 有 理 数 算法 。 


REX 


template <class R1, class R2> 
class ratio_equal: 
public std::integral constant« 


bool, (R1::num == R2::num) && (R1::den == R2::den)» 
UÜ: 
前 置 条 件 


R1 和 R2 必 须 是 std: : ratio 类 模板 的 实例 化 。 


示例 


std: :ratio_equal<std::ratio<1,3>, std::ratio<2,6> S:ivalue == true 
std: :ratio_equal<std: :ratio<1,3>, std::ratio<1,6> >::value == false 
std: :ratio equal<std::ratio<1,3>, std::ratio«2,3» >::value == false 
std: :ratio_equal<std::ratio<1,3>, std::ratio<1,3> >::value == true 


D.6.7 std::ratio_not_equal 类 模板 

std: :ratio_equal 类 模板 提供 了 在 编译 时 比较 两 个 std: :ratio 值 是 否 不 相 
等 的 机 制 ， 使 用 有 理 数 算法 。 
template <class R1, class R2> 


class ratio_not_equal: 
public std::integral constant«bool,!'ratio equal<R1,R2>::value> 


前 置 条 件 

R1 和 R2 必 须 是 std: : ratio 类 模板 的 实例 化 。 

示例 
std::ratio not equal<std::ratio<1,3>, std::ratio<2,6> »::value == false 
std::ratio not equal«std::ratio«1,3», std::ratio<1,6> >::value == true 
std::ratio not equal<std::ratio<1,3>, std::ratio<2,3> »::value == true 
std: :ratio not equal«std::ratio«1,3», std::ratio<1,3> >::value == false 


D.6.8 std::ratio_less 类 模板 


std::ratio less 模 板 提供 了 在 编译 时 比较 两 个 std: : ratio 值 ， 使 用 有 理 
数 算法 。 


定义 
template <class R1, class R2> 


class ratio less: 
public std::integral constant«bool,see below» 
E 


前 置 条 件 


R1 和 R2 必 须 是 std: : ratio 类 模板 的 实例 化 。 
结果 


std: :ratio less<R1,R2> 派 生 自 
std: :integral_constant<bool,value>， 这 里 value 是 (R1: :num*R2: : den) 
<(R2: :num*R1: :den)。 如 果 可 能 的 话 ， 其 实现 应 使 用 避免 洪 出 的 方法 来 计算 结 
果 。 如 果 发 生 了 溢出 ， 则 程序 就 是 病态 的 。 


示例 
std: :ratio_less<std: :ratio<1,3>, std::ratio<2,6> »::value == false 
Std::ratio less«std::ratio«1,6», std::ratio<1,3> »::value == true 


std::ratio less« 

std: :ratio<999999999,1000000000>-, 

std: :ratio<1000000001,1000000000> >: :Value == true 
std::ratio less« 

std: :ratio<1000000001,1000000000>, 

std: :ratio<999999999,1000000000> »::value == false 


D.6.9 std::ratio_greater 类 模板 


std: :ratio_greater 模 板 提 供 了 在 编译 时 比较 两 个 std: :ratio 值 ， 使 用 有 
里 数 算法 。 

定义 
template <class R1, class R2> 


class ratio_greater: 
public std::integral constant<bool, ratio less«R2,R1»::value» 


uU 
前 置 条件 


R1 和 R2 必 须 是 std: :ratio 类 模板 的 实例 化 。 


H 


D.6.10  std::ratio less equal2ZS Tf 


std::ratio less_equal 模 板 提 供 了 在 编译 时 比较 两 个 std: : ratio 值 ， 使 
用 有 理 数 算法 。 


定义 


template <class R1, class R2> 
class ratio less equal: 
public std::integral constant«bool,!ratio less«R2,R1»::value» 


Uu: 
前 置 条 件 


R1 和 R2 必 须 是 std: :ratio 类 模板 的 实例 化 。 


D.6.11 std::ratio_greater_equal 类 模板 


std: :ratio_greater_equal 模 板 提 供 了 在 编译 时 比较 两 个 std: :ratio 
值 ， 使 用 有 理 数 算法 。 


定义 
template <class R1, class R2> 


class ratio greater equal: 
public std::integral_constant<bool, !ratio less<R1,R2>::value> 


UU: 
前 置 条 件 


R1 和 R2 必 须 是 std: :ratio 类 模板 的 实例 化 。 


D.7 «thread» 3. x ff 
ethread> 头 文件 提供 了 用 来 管理 和 鉴别 线程 的 服务 以 及 让 当前 线程 挂 起 的 
头 文件 内 容 


namespace std 


| 


class thread; 


namespace this thread 


{ 


threads :ia get. 1d0) noexcept; 
void yield() noexcept; 


template«typename Rep,typename Period> 
void sleep for( 
Std::chrono::duration«Rep,Period» sleep duration); 


template«typename Clock,typename Duration» 
void sleep until { 
Std::chrono::time point«Clock,Duration» wake time); 


} 


D.7.1 std::threadZs 


std: :thread 类 用 来 管理 线程 的 执行 。 它 提供 了 开始 新 线程 运行 和 等 待 线程 
执行 完毕 的 方法 ， 以 及 标识 线程 的 方法 和 其 他 管理 线程 执行 的 函数 。 


class thread 


{ 


public: 


ys 


// Types 
class id; 
typedef implementation-defined native handle type; // optional 


// Construction and Destruction 
thread() noexcept; 


-.thread(í); 


template<typename Callable,typename Args...> 
explicit thread(Callable&& func,Args&&... args); 


// Copying and Moving 
thread(thread const& other) = delete; 
thread(thread&& other) noexcept; 


thread& operator-(thread const& other) - delete; 
thread& operator-(thread&& other) noexcept; 


void swap(thread& other) noexcept; 


void joini);:; 
void detaocbt); 
bool joinable{) const noexcept; 


id get id() const noexcept; 
native handle type native handle(); 


static unsigned hardware concurrency() noexcept; 


void swap(thread& lhs,thread& rhs}; 


std::thread::idZ5 


std: : thread: :id 的 实例 标识 一 个 特定 的 线程 的 执行 。 


类 定义 


class thread::id 


{ 


public: 
id() noexcept; 
13 
bool operator--(thread::id x, thread::id y) noexcept; 
bool operator!-(thread::id x, thread::id y) noexcept; 


bool operator«(thread::id x, thread::id y) noexcept; 
bool operator<=(thread::id x, thread::id y) noexcept; 
bool operator>(thread::id x, thread::id y) noexcept; 
bool operator»-(thread::id x, thread::id y) noexcept; 


template«typename charT, typename traits» 
basic ostream«charT, traits>& 
operator«« (basic ostream«charT, traits»&& out, thread::id id); 


注意 : 标识 一 个 特定 的 线程 执行 的 std: :thread: :id 值 ， 应 该 
与 默认 构造 的 std: :thread: :id 实例 的 值 和 所 有 代表 其 他 线程 执行 
的 值 都 不 相同 。 


对 特定 的 线程 ，std: :thread: :id 值 不 可 预测 ， 并 且 可 能 在 同一 个 程序 的 每 
次 执行 中 都 不 一 样 。 


std: :thread: :id 是 CopyConstructible 和 CopyAssignable 的 ， 
此 std: :thread: :id 的 实例 可 以 自由 地 复制 和 赋值 。 


std::thread::id 默 认 构 造 函 数 
构造 一 个 std: : thread: :id 对 象 并 不 表示 任何 线程 的 执行 。 
声明 

id{) noexcept; 
结 


构造 一 个 std: :thread: :id 实例 ， 包 括 特 别 的 非 任何 线程 (not any 
thread) 的 值 。 


引发 


注意 : 所 有 默认 构造 的 std: :thread: :id 实例 存储 相同 的 值 。 


std::thread::id 相 等 比较 运算 符 
比较 两 个 std: :thread: :id 的 实例 ， 看 它们 是 否 代表 了 相同 的 线程 的 执行 。 
声明 
bool operator--(std::thread::id lhs,std::thread::id rhs) noexcept; 
返回 
如 果 lhs 和 rhs 都 表示 相同 的 线程 的 执行 或 者 都 有 特别 的 非 任何 线程 值 ， 返 回 
true。 如 果 1hs 和 rhs 代 表 不 同 的 线程 的 执行 ， 或 者 其 中 一 个 表示 线程 的 执行 ， 
男 一 个 具有 特别 的 非 任 何 线程 值 ， 返 回 false。 
引发 
std::thread::id 不 等 比较 运算 符 
比较 两 个 std: :thread: :id 的 实例 ， 看 它们 是 否 代表 了 不 同 的 线程 的 执行 。 
声明 
bool operator!=(std::thread::id lhs,std::thread::id rhs) noexcept; 
返回 
! {lhs==rhs) 
引发 
Ts 


std::thread::id 小 于 比较 运算 符 


比较 两 个 std: :thread: :id 的 实例 ， 看 其 中 一 个 是 否 在 线程 ID 值 总 排序 中 排 
在 男 一 个 之 前 。 


声明 
bool operator< (std::thread::id lhs,std::thread::id rhs) noexcept; 
返回 


如 果 1Lhs 的 值 在 线程 ID 值 总 排序 中 出 现在 rhs 的 值 之 前 ， 返 回 true。 如 果 
lhs!=rhs，lhs<rhs 和 rhs<lhs 中 必然 有 一 个 返回 true， 另 一 个 返回 false。 如 
果 1lhs==rhs， 那 么 lhs<rhs 和 rhs<lhs 都 返回 false。 


引发 
无 。 


JER: 默认 构造 的 std: :thread: :id 实例 所 具有 的 特别 的 非 任 
何 线程 值 ， 它 小 于 任何 代表 了 线程 的 执行 的 std: :thread: :id 实 
例 。 如 果 两 个 std: :thread: : id 实例 相等 ， 那 么 谁 都 不 小 于 谁 。 任 
意 一 组 不 同 的 std: :thread: :id 值 都 可 以 构成 一 个 总 排序 ， 它 在 程 
序 的 执行 过 程 中 是 一 致 的 。 这 个 排序 在 同一 个 程序 的 每 次 执行 之 间 
可 能 会 变化 。 


std::thread::id 小 于 或 等 于 比较 运算 符 


比较 两 个 std: :thread: :id 的 实例 ， 看 其 中 一 个 是 否 在 线程 ID 值 总 排序 中 排 
在 男 一 个 之 前 或 与 之 相等 。 


声明 

bool operator<=(std::thread::id lhs,std::thread::id rhs) noexcept; 
返回 

! (rhs«1hs) 
引发 


无 o 
std::thread::id 大 于 比较 运算 符 


比较 两 个 std: :thread: :id 的 实例 ， 看 其 中 一 个 是 否 在 线程 卫 值 总 排序 中 排 
在 另 一 个 之 后 。 


声明 
bool operator>(std::thread::id lhs,std::thread::id rhs) noexcept; 
返回 
rhs<lhs 
引发 
Te 
std::thread::id 大 于 或 等 于 运算 符 


比较 两 个 std: :thread: :id 的 实例 ， 看 其 中 一 个 是 否 在 线程 卫 值 总 排序 中 排 
在 另 一 个 之 后 或 与 之 相等 。 


声明 
bool operator>=(std::thread::id lhs,std::thread::id rhs) noexcept; 
返回 
! (lhs<rhs) 
引发 
Es 
std::thread::id 流 插入 运算 符 
将 表示 std: :thread: :id 值 的 字符 串 写 到 指定 的 流 中 。 
声明 


template<typename charT, typename traits> 
basic_ostream<charT, traits>& 
operator«« (basic ostream«charT, traits>&& out, thread::id id); 


rte 
zh 


将 表示 std: :thread: :id 值 的 字符 串 插入 到 指定 的 流 中 。 
返回 


out 


注意 : 字符 串 表示 的 格式 并 未 指定 。 相 等 的 std: :thread: :id 
实例 具有 相同 的 表示 ， 不 等 的 实例 具有 不 同 的 表示 。 


std::thread::native_handle_typetypedef 
native_handle_type 是 一 个 到 可 用 于 特定 平台 API 类 型 的 typedef。 
声明 
typedef implementation-defined native handle type; 


注 ” 该 typedef 是 可 选 的 。 若 存在 ， 则 其 实现 应 当 提 供 一 个 适用 
于 本 地 特定 平台 API 的 类 型 。 


std::thread::native handleJX, 5i rK Zi 
返回 native_handle_type 类 型 的 值 ， 它 代表 着 与 *this 关 联 的 执行 线程 。 
声明 


native handle type native handle(); 


注 ”该 函数 是 可 选 的 。 若 存在 ， 则 返回 值 应 该 适用 于 本 地 特定 
XE & APT. 


std::thread 默 认 构 造 函 数 
构造 不 与 执行 线程 相关 联 的 std: :thread 对 象 。 
声明 

thread() noexcept; 


ete 
结 


构造 std: :thread 实 例 ， 它 没有 关联 的 执行 线程 。 
后 置 条 件 
对 新 构造 的 std: :thread 对 象 x，x.get_id()==id()。 
引发 
X. 

std::thread 构 造 函数 
构造 与 新 的 执行 线程 相关 联 的 std: :thread 对 象 。 


声明 
template<typename Callable,typename Args...> 
explicit thread(Callable&& func,Args&&... args); 

前 置 条 件 

func 和 args 的 每 个 元 素 必须 是 MoveConstructible 的 。 

结果 


构造 std: :thread 实 例 并 将 它 关 联 至 新 创建 的 执行 线程 。 复 制 或 移动 func 和 
args 的 每 个 元 素 到 内 部 存储 中 ， 并 持续 在 新 的 执行 线程 的 整个 生命 周期 。 在 新 的 


执行 线程 上 执行 INVOKE(copy-of-func,copy-of-args)。 
后 置 条 件 
对 新 构造 的 std: :thread 对 象 x，x.get_id()!=id()。 
引发 


如 果 不 能 启动 新 线程 ， 引 发 std: :system_error 类 型 的 异常 。 将 func 
或 args 复 制 进 内 部 存储 时 引发 的 任何 异常 。 


同步 
对 构造 函数 的 调用 ， 发 生 于 在 新 创建 的 执行 线程 上 执行 给 定 函 数 之 前 。 
std::thread 移 动 构造 函数 


将 执行 线程 的 所 有 权 从 一 个 std: :thread 对 象 转移 到 新 创建 的 std: :thread 
对 象 。 


声明 
thread (thread&& other) noexcept; 

结果 

构造 std: :thread 实例。 如 果 other 在 调用 构造 函数 之 前 拥有 一 个 相关 联 的 
执行 线程 ， 该 执行 线程 现在 关联 至 新 创建 的 std: :thread 对象。 否则 ， 新 创建 的 
std: :thread 对 象 没 有 相关 联 的 执行 线程 。 

后 置 条 件 


对 新 构造 的 std: :thread 对 象 x/，x.get_id() 的 与 调用 构造 函数 
前 other .get_id() 的 值 相等 。other.get_id()==id()。 


引发 
无 。 


ik std: :thread 对 象 不 是 Copyconstructible 的 ， 所 以 没有 
找 贝 构造 函数 ， 只 有 这 个 移动 构造 函数 。 


std::thread 析 构 函 数 
销毁 std: :thread 对 象 。 
声明 

~thread () ; 
结果 


销毁 *this。 如 果 *this 拥 有 相关 联 的 执行 线程 (this->joinable() 会 返回 
true) ， 调 用 std: :terminate() 来 结束 程序 。 


引发 
无 。 
std::thread 移 动 赋值 运算 符 


将 执行 线程 的 所 有 权 从 一 个 std: :thread 对 象 转移 到 男 一 个 std: :thread 对 
象 。 


声明 
thread& operator=(thread&& other) noexcept; 

结果 

如 果 在 调用 之 前 this->joinable() 返 回 true， 调 用 std: :terminate() 来 
结束 程序 。 如 果 other 在 赋值 之 前 拥有 一 个 相关 联 的 执行 线程 ， 该 执行 线程 现在 
关联 至 *this。 否 则 ，*this 没 有 相关 联 的 执行 线程 。 

后 置 条 件 


this->get_id() 与 调用 前 other.get_id() 的 值 相 
4*, other.get id()--id(). 


引发 
无 。 


ik std::thread 对 象 不 是 Copyconstructible 的 ， 所 以 没有 
拷贝 赋值 运算 符 ， 只 有 这 个 移动 赋值 运算 符 


std::thread::swap 成 员 函 数 

在 两 个 std: :thread 对 象 之 间 交 换 它 们 相关 的 执行 线程 的 所 有 权 。 

声明 
void swap(thread& other) noexcept; 

结果 

如 果 other 在 调用 之 前 拥有 一 个 相关 联 的 执行 线程 ， 该 执行 线程 现在 关联 至 
*xthis。 人 否则 *this 没 有 相关 联 的 执行 线程 。 如 果 *this 在 调用 之 前 拥有 一 个 相关 
联 的 执行 线程 ， 该 执行 线程 现在 关联 至 other。 和 否则 other 没有 相关 联 的 执行 线 
程 。 

后 置 条 件 


this->get_id() 与 调用 前 other.get_id() 的 值 相 等 。other.get_id() 与 
调用 前 this->get_id() 的 值 相等 。 


引发 
254 
swap 非 成 员 函 数 
在 两 个 std: :thread 对 象 之 间 交 换 它们 相关 的 执行 线程 的 所 有 权 。 
声明 


void swap(thread& lhs,thread& rhs) noexcept; 


结 
lhs.swap (rhs) 
引发 


Te 
std::thread::joinable 成 员 函 数 
查询 *this 是 否 拥有 关联 的 执行 线程 。 
声明 
bool joinable() const noexcept ; 
返回 
如 果 *this 拥 有 相关 联 的 执行 线程 ， 返 回 true， 否 则 false。 
引发 
X. 
std::thread::join 成 员 函 数 
等 待 与 *this 相 关联 的 执行 线程 结 
声明 
void join{); 
前 置 条 件 
this->joinable() 应 返回 true。 
结果 
阻塞 当前 线程 ， 直 到 与 *this 关 联 的 执行 线程 结 
后 置 条 件 
this->get_id()==id()。 在 调用 之 前 与 *this 关 联 的 执行 线程 已 结 
同步 


在 调用 前 与 *this 相 关联 的 执行 线程 执行 完毕 ， 发 生 于 对 join() 的 调用 返回 


如 果 无 法 得 到 结果 ， 或 者 this->joinable() 返 回 false， 引 发 


std::system error. 
std::thread::detach/X 5i pK Zt 
分 离 与 *this 相 关联 的 执行 线程 以 结束 。 
声明 
void detach(); 
前 置 条 件 
this->joinable() 应 返回 true。 
2 
分 离 与 *this 相 关联 的 执行 线程 。 
后 置 条 件 
this->get_id()==id(), this->joinable==false. 


在 调用 前 与 *this 相 关联 的 线程 被 分 离 ， 并 且 不 再 拥有 相关 联 的 
std: :thread 对 象 。 


引发 
如 果 无 法 得 到 结果 ， 或 者 在 调用 时 this->joinable() 返 回 false， 引 发 


std::system error. 


std::thread::get_id 5i Pj ZA 
返回 标识 着 与 *this 关 联 的 执行 线程 的 值 。 
声明 

thread::id get id() const noexcept; 
返回 


如 果 *#this 拥 有 相关 联 的 执行 线程 ， 返 回 标识 着 该 线程 的 std: :thread: :id 
实例 。 否 则 返回 一 个 默认 构造 的 std: :thread: : id. 


引发 


无 。 
std::thread::hardware_concurrency## æ JX, n Ph BL 
返回 在 当前 硬件 上 能 够 并 发 运行 的 线程 数目 的 提示 。 
声明 
unsigned hardware concurrency() noexcept; 
返回 


在 当前 硬件 上 能 够 并 发 运行 的 线程 数目 。 例 如 ， 可 能 是 系统 中 处 理 器 的 数 
量 。 当 此 信息 不 可 用 或 者 没有 妥善 定义 ， 函 数 返回 6。 


引发 
无 。 


D.7.2 this_thread 命 名 空间 
std: :this thread 命名 空间 中 的 函数 在 调用 线程 上 运行 。 
std::this_thread::get_id4E AX 5i RA žr 
返回 一 个 std: : thread: :id 类 型 的 值 ， 标 识 当前 的 执行 线程 。 
声明 
thread: :id get 1IQ() noexcept ; 
返回 
标识 当前 线程 的 一 个 std: :thread: :id 的 实例 。 
引发 
Já. 
std::this thread::yield-|E X, 5i P Zi 


用 来 告知 类 库 ， 调 用 该 函数 的 线程 不 坝 要 在 调用 处 运行 。 通 % 
环 中 ， 以 避免 消耗 过 多 的 CPU 时 间 。 


声明 


di 
d 
ES 
EÑ 
m 
(个 


void yield() noexcept; 
结果 
为 类 库 提供 一 个 机 会 ， 可 以 调度 其 他 的 事情 来 伏 代 当前 线程 。 
引发 
无 。 
std::this_thread::sleep_for 非 成 员 函 数 
将 当前 线程 的 执行 挂 起 一 段 指定 的 时 间 。 
声明 


template<typename Rep,typename Period» 
void sleep for(std::chrono: :duration<Rep, Period> const& relative time); 


an 
zh 


阻塞 当前 线程 ， 直 到 指定 的 relative_time 逝 去 。 


TE ”线程 可 能 会 比 指定 的 时 间 段 阻塞 更 入 。 如 果 可 能 的 话 ， 挝 
去 时 间 应 由 匀速 时 钟 来 决定 。 


引发 
Jie 
std::this_thread::sleep_until 非 成 员 函 数 
挂 起 将 当前 线程 的 执行 ， 直 到 达到 指定 的 时 间 点 。 
声明 
template<typename Clock,typename Duration> 


void sleep_until { 
std::chrono::time point«Clock,Duration» const& absolute time); 


结果 


阻塞 当前 线程 ， 直 到 指定 的 Clock 达 到 了 指定 的 absolute_time。 


注 ”没有 保证 调用 线程 会 被 阻塞 多 久 ， 除 非 Clock: :now() 返 回 
的 时 间 等 于 或 者 晚 于 absolute_time 的 时 候 线程 才 会 解除 阻塞 。 


引发 


欢迎 来 到 异步 社区 ! 
异步 社区 的 来 历 


异步 社区 (www.epubit.com.cn) 是 人 民 邮 电 出 版 社 旗 下 IT 专 业 图 书 旗舰 社区 ， 
于 2015 年 8 月 上 线 运 营 。 


异步 社区 依托 于 人 民 邮 电 出 版 社 20 余 年 的 I 开 专 业 优 质 出 版 资源 和 编辑 集 划 团 
队 ， 打 造 传统 出 版 与 电子 出 版 和 自 出 版 结合 、 纸 质 书 与 电子 书 结合 、 传 统 印 刷 与 
POD 按 需 印 刷 结合 的 出 版 平台 ， 提 供 最 新 技术 资讯 ， 为 作者 和 读者 打造 交流 互动 


的 平台 。 


近期 活动 


异步 社区 成 立 一 周年 大 型 活动 3 iD 异步 社区 成 立 一 周年 大 型 婚 书 活动 开启 ! 

异步 社区 的 来 历 异步 社区 是 人 民 闻 思 出 版 社 旗下 
IT 专 , 业 图 书 旗 航 社区 ,于 2015 年 8 月 上 线 运 
营 ， 异 步 社区 依托 于 人 民 部 电 出 版 社 20 疾 年 的 IT 
专业 -. 
mn LEA 2016-08-02 
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Sum ( 译 者 ) 


社区 里 都 有 什么 ? 


购买 图 书 
我 们 出 版 的 图 书 涵盖 主流 IT 技术 ， 在 编程 语言 、Web 技 术 、 数 据 科学 等 领域 


有 众多 经 典 畅销 图 书 。 社 区 现 已 上 线 图 书 1000 余 种 ， 电 子 书 400 多 种 ， 部 分 新 书 
实现 纸 书 、 电 子 书 同步 出 版 。 我 们 还 会 定期 发 布 新 书 书 讯 。 


下 载 资 源 
社区 内 提供 随 书 附 赠 的 资源 ， 如 书 中 的 案例 或 程序 源 代 码 。 


| 
下 载 。 


与 作 译 者 互动 


很 多 图 书 的 作 译 者 已 经 入 驻 社区 ， 您 可 以 关注 他 们 ， 咨 询 技术 问题 ， 可 以 阅 
读 不 断 更 新 的 拉 术 文章 ， 听 作 译 者 和 编辑 畅 聊 好 书 背 后 有 趣 的 故事 ， 还 可 以 参与 
社区 的 作者 访谈 栏目 ， 向 您 关注 的 作者 提出 采访 题目 。 


灵活 优惠 的 购书 


您 可 以 方便 地 下 单 购 买 纸 质 图 书 或 电子 图 书 ， 纸 质 图 书 直接 从 人 民 邮 电 出 版 
社 书 库 发 全， 电子 书 提供 多 种 阅读 格式 。 


ee 社区 提供 预 售 和 新 书 首发 服务 ， 用 户 可 以 第 一 时 间 买 到 心仪 


用 户 帐 户 中 的 积分 可 以 用 于 购书 优惠 。100 积 分 =1 元 ， 购 买 图 书 时 ， 在 
:里 填 入 可 使 用 的 积分 数值 ， 即 可 扣 减 相应 金额 。 


购买 本 电子 书 的 读者 专 享 异步 社区 优惠 券 。 使 用 方法 : 注册 成 为 社区 用 户 ， 在 下 单 购书 时 输 
入 “57AWG”， 然 后 点 击 “ 使 用 优惠 码 ”， 即 可 享受 电子 书 8 折 优 惠 (本 优惠 券 只 可 使 用 一 次 ) 。 


纸 电 图 书 组 合 购买 


社区 独家 提供 纸 质 图 书 和 电子 书 组 合 购 买方 式 ， 价 格 优 惠 ， 一 次 购买 ， 多 种 
阅读 选择 。 


软 技 能 : 代码 之 外 的 生存 指南 
[Š] Z. 森 梅 芯 ( John Z. Sonmez ) (作者 ) =I GS) iss (EARR) 
C 6 9. OK 


ws ` s. $3.38 * 
I> ETS mim sux 


这 星 一 本 真正 从 “人 ” ( 而 非 技 术 也 非 管理 ) 8SAEGUISSUTDA ADESSET. 0301585 
ABRFRSSIR . VASSAR. GLAS "A" HA, SHSM STW WAR 
ABW A “SRA . 

本 书 暴 焦 于 软件 开发 人 员 生 活 的 方方面面 , 从 揭秘 画 试 的 污 程 到 精 耕 纪 作出 一 份 杀 手 级 简历 ， Ae! 
建 大 过 欢迎 的 地 客 到 打 址 你 的 个 人 品牌 ， 从 提高 引 己 工作 效 至 到 与 如 何 与 “ 郊 延 年 ”做 斗争 ， 基 至 
包括 如 何 投资 不 动产 ， 如 何 关注 合 己 的 健康 , 

本 书 共 分 为 职业 简 、 生 我 营销 箭 、 学 习 简 、 生 产 力 简 、 理 财 简 、 健 身 简 、 精 神往 等 七 箭 ,概括 了 软 
件 行 业 从 业 人 员 所 需 的 “ 软 技 能 ” . 


& 纸 质 版 «59.00 Y4602(781 


电子 版 + 纸 质 版 ”着 59.00 


社区 里 还 可 以 做 什么 ? 
提交 勘误 


您 可 以 在 图 书页 面 下 方 提交 勘误 ， 每 条 勘误 被 确认 后 可 以 获得 100 积 分 。 热 
心 勘误 的 读者 还 有 机 会 参与 书稿 的 审 校 和 翻译 工作 。 


写作 


社区 提供 基于 Markdown 的 写作 环境 ， 训 欢 写作 的 您 可 以 在 此 一 试 届 手 ， 在 社 
Ce ene E alae es 


如 果 成 为 社区 认证 作 译 者 ， 还 可 以 享受 异步 社区 提供 的 作者 专 享 特色 服务 。 
AUR NR AD 
您 可 以 掌握 T 圈 的 技术 会 议 资讯 ， 更 有 机 会 免费 获 赠 大 会 门票 。 


加 入 异步 


扫描 任意 二 维 码 都 能 找到 我 们 : 


ii 


微 信 订阅 号 


QQ 群 : 368449889 


社区 网 址 : www.epubit.com.cn 
官方 微 信 : 异步 社区 
官方 微 博 : @ 人 邮 和 异步 社区 ，@ 人 民 邮 电 出 版 社 -信息 技术 分 社 


投稿 & 咨 询 : contact@epubit.com.cn 


人 
看 完了 

如 果 您 对 本 书 内 容 有 疑问 ， 可 发 邮件 至 contact@epubit.com.cn， 会 有 编辑 或 
作 译 者 协助 答疑 。 也 可 访问 异步 社区 ， 参 与 本 书 讨论 。 

如 果 是 有 关 电 子 书 的 建议 或 问题 ， 请 联系 专用 客服 邮箱 : 


ebook@epubit.com.cn. 
在 这 里 可 以 找到 我 们 : 


。 微 博 : @ 人 邮 异 步 社 区 
e QQ 和 群 : 368449889 


